@niftyトップ

辞書、事典、用語解説などを検索できる無料サービスです。

Nグラム【えぬぐらむ】

図書館情報学用語辞典

Nグラム
任意の文字列や文書を連続したn個の文字で分割するテキスト分割方法.特に,nが1の場合をユニグラム(uni-gram),2の場合をバイグラム(bi-gram),3の場合をトライグラム(tri-gram)と呼ぶ.最初の分割後は1文字ずつ移動して順次分割を行う.図書館情報学の分野では,検索システムにおける索引の自動抽出においてよく用いられる.例えば,「図書館情報学」をバイグラムで分割すると,「図書」「書館」「館情」「情報」「報学」となる.形態素解析を行って単語境界を識別して分割する方式と比べ,検索漏れが起きにくい,分割が機械的で容易なため多言語への対応が容易などの長所がある.しかし,情報検索や自動分類へ応用する際にはノイズが多くなる,転置ファイルのサイズが大きくなるなどの短所がある.

出典:図書館情報学用語辞典 第4版
©All Rights Reserved, Copyright Nihon Toshokan Joho Gakkai, 2013 編者:日本図書館情報学会用語辞典編集委員会 編
それぞれの用語は執筆時点での最新のもので、常に最新の内容であることを保証するものではありません。

Nグラム」の用語解説はコトバンクが提供しています。

Nグラムの関連情報

他サービスで検索

(C)The Asahi Shimbun Company /VOYAGE MARKETING, Inc. All rights reserved.
No reproduction or republication without written permission.

アット・ニフティトップページへ アット・ニフティ会員に登録

ウェブサイトの利用について | 個人情報保護ポリシー
©NIFTY Corporation