SiriとGUIはどっちがすごいのか?

イラスト:
上段の絵は、人間が発した言葉を表す吹き出しの中にグニャグニャした形がある。その形が人型ロボットが受け取っているが三角錐の形に変わっている。人間が意図したものと異なる受け取り方をしている。
下段の絵は、人間とロボットの間に三角錐が一つあり、人間がそれを指差していてロボットがなるほど!といったように閃いている様子。

Siriは便利だ。タイマーをセットするときに使っている。そして、それ以外には使っていない。

SFの世界に出てくることが実現しそうになると盛り上がる、あれの1つであることは間違いない。 空飛ぶ自動車、時計の電話に口を近づけ話す、チューブの中を車が走る、立体の投影動画、半透明のディスプレイ、立体的なスクリーンをジェスチャで操作、そして瞬間移動。SFでもオカルトSFというジャンルはファンタジーに近いものもある。ジェスチャーや言葉によるコントロールは、魔法使いの呪文のしぐさ、魔法の言葉にも近い。

Siriもその一つ。この流れはどうなるだろうか。 まず、タイマー以外に試したが、あまり使えるものではなかった。なので、自分の使用方法としては定着していない。

タイマーで使えるというのはむしろ発見に近いものがあった。ちゃんとSiriに通じてなおかつ有用な魔法の呪文をみつけたのだ。

これはどういうことかというと、Siriに通じる呪文は隠蔽されているのである。大げさに言えば呪文の書を知らなければ使えない。

もともと、この方向というのは何を目指しているのかを考えてみる。何に憧れているものなのか。

言えばやってくれる世界、だろうか。 自分が曖昧に言っても誰かがいいことをしてくれる世界といってもいいかもしれない。

まるで人のように。

コンピュータを人のように扱いたいのかは、人によるだろう。自分はコンピュータと話していたら何か淋しい気がするタイプだ。話すなら人と話したい。

とはいえそうでないタイプもいるだろう。では人を目指すならば、ゴールは人ということになる。もしかしたらゴールではないかもしれないが通過点であることは間違いないだろう。ということで、人と人はどのようにやりとりしているかを考えてみよう。

人というのは言えばやってくれるが、その結果はまちまちだ。いい結果になる場合もあるし、そうでない場合もある。

曖昧な言葉で言えば伝わらないこともある。曖昧な言葉で言ってもいいことをしてくれることもある。 その過程では互いに言葉や、そのほかの様々な表現も使いながら擦り合わせているだろう。

それでも行き違いもある。

そもそもそれが人と人が関わるということなのだ。

なので擬人化エージェントに人との関わりを求めるならば、通じないことを怒ってはいけない。コンピュータでなくても行き違いはあるのだから。(いや、人相手にも怒ることはあるからいいのかもしれない。ただし、行き違い自体を無くそうとすることは、擬人化エージェントに対する「人よりもさらに通じる存在になってほしい」ということだろう。)

仮に擬人化エージェントとのやりとりの手段が音声だけであるならば、それは電話のみのやりとりに近い。単純なことならいいが、少し複雑になるとなかなか難しい。互いの近況とその感想を聞くくらいなら良いが、3番目にあるものを15番目に移動して、その中の不要なものは削除して、、なんてのはすぐにぐちゃぐちゃになる。

そして、擬人化エージェントに通じる範囲を考え、通じる言い方を探る、魔法の呪文問題を乗り越えながら見つけることが大事。アラジンの「開けゴマ!」のように。 このような世界はコマンドを知らなきゃ使えないインターフェースと近いだろう。

では、音声だけでない場合はどうだろう。

「これ」であってますか?「これ」の中から選んでください。そんなやりとりがあるだろう。

これは結局はGUIにつながる方向だ。

やはりGUIは発明だ。浸透しすぎて透明になり、音声コントロールに憧れるくらいに忘れ去られているが。

対象が示され自らが操作する、そのことがコンピュータを操作することと一体化しているので、(振る舞いが隠蔽されていることはあっても、)自分が何をどうしたかについての曖昧さはない。

やりとりを高度にしようとすればするほど、ユーザーは脳内に仮想のGUIをイメージしながら話をすることになる。結局、最初は音声だがほとんどGUIみたいなことになる。

そうしないと何をどうするのかがはっきりしないからだ。

コンピュータと、何をどうするかについてGUI以外で共有できるならば可能性があるだろうか。脳内に仮想のGUIをイメージするよりも、身の回りのものが反応するような範囲の使い方。 音声による家電操作の類いの話になるかもしれないが、身の回りの家電が結果を直接表すし、操作対象も少なくまあまあ明確だ。「四合炊いて」「追い焚きスタート」とか。それでも二階のエアコンを、、なんてやりだすと直接操作感はどんどん薄れる。本当に操作できたのか確認するために、二階のエアコンの状況を教えて、、なんてのが必ずセットになってしまうかもしれない。

GUIならどうだろう。現実世界の「対象を選択し何かをする」ということを模していること、それでいて、ある程度抽象的な概念も扱えること、現実世界よりは間接的ではあるがイディオムも含め、デフォルメし箱庭的なサイズにできること(二階に行かなくても二階のエアコンの状況がわかる)などは、GUIの良さだ。

2次元で表現できるならばという制限があるが、これは弱点でありつつも、人間の理解も2次元のほうがいい場合もある。(やや強引な2軸4象限の図のほうが正確な3軸の図よりもとっつきやすいように)

GUIはやっぱりすごい。GUIの次のUIは?なんて思考になるけど、GUIというのは頭1つ以上飛び抜けていて、置き換わるのではなく併用するなら何があるのか?ということなんじゃないか。それくらいGUIは発明なのだと思う。