• News
  • 共通

単語への親密度を示した語意データベース、NTT印刷が発売

DIGITAL X 編集部
2021年10月15日

日本語約16万3000語への馴染み深さなどを示したデータベースの最新版をNTT印刷が2021年10月8日に発売した。NTTコミュニケーション科学基礎研究所(NTT-CS研)が人の言語機能の解明などのために調査・蓄積したデータを外販する。同日に発表した。

 NTT印刷が発売した「NTT語彙データベース」は、言葉の馴染み深さを示す単語親密度や、単語のアクセントのつけ方、表記の妥当性などの単語別データベース(図1)。NTTコミュニケーション科学基礎研究所(NTT-CS研)が日本語の主観的特性値を調査してきたデータを集めたもので、単語を介した世相の変化などが推測できる。

図1:「NTT語彙データベース」の概要

 最新となる令和版では、単語親密度について、記載済みの単語を再調査すると同時に、新しい単語を追加調査した。合計で日本語約16万3000語を収録している。

 NTT語彙データベースはDVDとして提供され、価格は1枚7万7000円(送料・消費税込)。同社の専用Webサイトから申し込める。