以下Google Japan Blogより抜粋
Google日本語入力は桁違いの語彙力を持っています。Webから機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web上の大量データから統計的言語モデルを構築し、変換エンジンを構成しています。現在のWebのありのままを反映したインプットメソッドと言えます。(この辞書および統計的言語モデルの生成はGoogleの大規模分散処理システムMapReduceを用いて、数千大規模の計算機クラスタを使って行っています)。さらに、強力なサジェスト機能によりこれらの大量の単語を少ないキー数で入力することが出来ます。
システム的なことはわからないけど実際に使ってみると、語彙力と変換力に驚きます。
それからこのソフトが生まれたのがGoogleの20%ルールからって言うのがいいですね。
そういうところも含めて、Googleという会社はやっぱり面白いっすね。
0 件のコメント:
コメントを投稿