単語を平面(2次元の地図)に置いて、「似たことばは近く、関係が同じペアは同じ向き」に並べてみる体験アプリです。 コンピュータが言葉を「数(ベクトル)」として扱う word2vec の考え方を、手を動かして体感できます。
👉 アプリをはじめる (演習が終わったら、このページに戻って下の解説を読んでみてください)
- 画面の平面に、単語のチップを置いていきます。
- 「似ていることばは近くに」「ちがうことばは遠くに」置くのがコツ。
- 全部置いたら チェック すると、点数(スコア)が出ます。
- 「答え合わせ」で、お手本とどれくらい近いか見られます。
最初からいくつかの単語は 動かせない状態で置いてあります。これは「地図の向きの目印(ヒント)」です。
総合点は、2つのスコアを混ぜて計算しています。
- score1:お手本の地図と、どれだけ「同じ形」に置けたか
- score2:「近いはず・遠いはず」のルールを、どれだけ守れたか
順番に見ていきましょう。
word2vec の世界では、地図の「向き」や「大きさ」そのものには意味がありません。 大事なのは ことばどうしの位置関係(どれが近くて、どれが遠くて、どっち向きか)です。
たとえば下の2つの地図は、回したり大きさを変えただけで「形」は同じです。 だから どちらも正解 とみなしたい。
地図A 地図B(Aを回しただけ)
ねこ いぬ
・ ・
・いぬ ねこ・
そこで score1 では、回したり・裏返したり・拡大縮小したり・平行移動しても OK という前提で、 お手本にいちばんピッタリ重なるように合わせてから、ズレを測ります。 この「いちばんよく重ねる」やり方を、数学では プロクラステス解析(Procrustes analysis) と呼びます。
あなたの配置を
① 真ん中をそろえる(平行移動をなくす)
それぞれの「重心(平均の位置)」を原点に移動します。
ここで
② 大きさをそろえる(スケールをなくす)
全体の広がり(大きさ)を1にそろえます。
お手本
③ いちばん重なるように回す(回転・反転)
あなたの地図を「クルッ」と回して(必要なら裏返して)、お手本にいちばん近づく角度を探します。 2次元なら、回転は次の行列で表せます。
「いちばん近づく角度
④ ズレ(残差)を測って点数にする
重ね合わせたあとに残った「ズレの大きさ」$d$ を測ります。
ズレが小さいほど高得点になるように変換します(イメージ)。
つまり 「形がそっくり = 高得点」。向きや大きさがちがっても、形が合っていれば満点に近づきます。
問題ごとに「このペアは近いはず」「このペアは遠いはず」というルールが決まっています。 score2 は、そのルールを どれだけ守れたか(達成率) です。
- 「近いはず」のペア → ちゃんと近くに置けていれば ✅
- 「遠いはず」のペア → ちゃんと遠くに置けていれば ✅
形(score1)は合っていても、特定のペアの距離がイマイチなときに、ここで差がつきます。
このアプリは体験用に 2次元(平面) にしていますが、本物の word2vec は単語を 数百次元(たとえば100〜300個の数の並び)のベクトルで表します。次元が多いほど、 「色」「大きさ」「気持ち」みたいなたくさんの意味の軸を同時に表せます。
本物では、ことばの近さを測るのに コサイン類似度(ベクトルの「向き」の近さ)をよく使います。
有名な例として、ベクトルどうしの足し算・引き算で意味の関係が表せることがあります。
(「王」から「男」を引いて「女」を足すと「女王」に近づく、というイメージ)
このアプリで「同じ関係のペアは同じ向き・同じ距離になる」と感じた感覚が、 実はこの足し算・引き算の世界につながっています。
- ベクトル / 内積 / コサイン類似度
- 次元(2次元 → 数百次元)
- プロクラステス解析、特異値分解(SVD)
- word2vec / 単語埋め込み(word embedding)
この教材はオープンキャンパス体験用に作成されています。
- 琉球大学工学部工学科知能情報コース
- 2026年度オープンキャンパス
- 説明担当: 當間愛晃
- ライセンス: CC BY 4.0