2021/6/25

認識について・人工知能に向けて

先の「053の認識について」で、
人間の認識が、基本とするところは五感の刺激を
知覚するためのものであると説明した。
また、認識の際には刺激の関連する要素は
相当数が関係していることも書いた。

さて、では、人工知能が刺激の認識を行う場合には
どのようにしたらよいだろうか、という話である。

初期の知能においては、刺激は刺激だけの
五感に直結する単独の刺激であるはずである。
過去の記憶や経験がないわけだから、刺激について関連させられる記憶の
要素を持っていないからである。

では、それらの刺激の入力を繰り返す間に、
どのようにして認識に際しての関連する要素が増えていくのだろうか。

053でも使った「マスクの内側の白い色」についての刺激について考えてみる。
今でこそ、マスクも知っているし、白い色も知っている。
それだからこそ、その色についての視覚の刺激を受けた場合に、
それが白い色だと認識できる。

では、これが赤ん坊の時に見たマスクの内側の色の視覚刺激だったら
どうなるだろう。
恐らくは、「何か視界に映っている」ということだけだろう。
特に生まれて初期の頃は視力が悪いらしいので、
ぼんやりと何かが視界に映っているだけである。
やがては、マスクを何かの物体として形あるものとして認識できるようになるが、
それ以前は、そういう関連する情報は少ないが、ぼんやりとした何かとしてしか
認識できないのである。

結局それが視覚で見えて、触って、引っ張って、噛んで、
物体としての何かとしての関連する情報を認識しながら、マスクを覚えていくのである。

やがて意味も分からずに言葉を真似し、それを聴覚から刺激として認識することになる。
言葉にはやがて視覚などの他の五感から刺激として受けた刺激を関連する要素として
同時に認識し、その認識する対象についての関連する刺激の要素を増やしていく。

こうして何らかの物体であった視覚で認識できた何かが、
様々な刺激によって関連付けられて、彩られた対象として認識されることになる。

その時点で、知能はその物体を認識できるようになったと言える。

人工知能として知能の発達をさせるためには、
やはり刺激を知覚することのできる感覚がいくつか必要になる。
できれば人間の知能に準じた五感が備わっていることが望ましい。

最も情報量が多いものであれば、視覚が優先される。
次は、聴覚である。
恐らく視覚と聴覚の実装がどうにかなれば、知能として意識の準備位までは
できるだろうと思われる。
あと必要なのは出力である。
これは、まぁ音声出力が優先されるだろう。
音声と聴覚は最も人間とコミュニケーションしやすい感覚であり刺激である。

---------------
まず視覚と聴覚が実装できたとしよう。
実装については、
刺激の入力と、その刺激を特定の感覚の刺激として分類し、
それを記憶し、想起できる事。

刺激については
視覚については認識する対象について
注意を向けることができること。
聴覚については認識する対象について
波長をとらえて特定のフレーズ等で区切ることができること。
---------------
刺激の認識が行えるということは、
連続した刺激の認識が行えるということになり、
そこには意識が生じる事となる。

意識という何か姿のあるものができるわけではないが、
連続した認識をするという活動自体が意識の姿そのものである。

この時点では、その意識の存在について確認することはできない。
恐らくプログラムによる動作によって
何か刺激の記憶している量が増えているということだけが
分かるはずである。

認識によって刺激の知覚する数量は激増する。
認識自体に記憶する事が関係しているため、
その記憶の量も一気に増える。

意識を意識たらしめているものは何か、
連続した認識に意識が生じると考えているが、
はたして連続した認識のみで意識が生じるかどうか考えてみる。

通常、人間では意識の存在は応答によって確認することになる。
問いかけに正しく答えるとかではなく、反応を示すことが
意識の存在の確認となる。
対象の状態によっては会話ができないとか、四肢が動かせない
という状況もあるからである。

では、連続した認識だけが存在する状態において
意識の確認が行えるかどうかであるが、
視覚の応答については、視覚刺激に対して注意を向ける事ができるかどうかである。
聴覚の応答についても同様であるが、その音声に対して認識ができるかどうか
ということなのだが、これについては少し確認する方法が難しい。
応答によって何らかの音声が発せられれば良いのだが、
この機能は認識だけの機能では発声まではできない。
発声には模倣するという機能が必要となる。

---------------
少し話がそれるが、模倣について少し話そう。

音声の発声、模倣においては、
赤ん坊の内は、初期においては「あー」とか「うー」とかの発声しかできないが、
やがて音声を聞いて、認識し、その模倣において様々な発声の組み合わせを
発声しながら試しながら聴覚で認識した音声と同じ発声を真似しながら記憶する。

知能の初期においては、聴覚の音声の認識においては、
関連する記憶の要素を持たないため、何かの音の組み合わせという程度の
認識となる。
その音声のまとまりに何か意味があって音声を認識したり、模倣によって発声することはない。
例えば、何かの音声のまとまりを発声したことによって周囲の親などが喜んだりすると、
それを繰り返して発声するなど、周囲がよろこんでいるから発声しているという位の
意味合いで発声することになる。

応答や会話が成り立つようになるのは、
自らの欲求において、泣いたりして周囲に働きかけを行い、
それについて周囲が反応を示すことを繰り返し、
その反応について認識するようになってからである。

知能が周囲へ働きかけを行うのは、
知能を持つ個体の欲求における価値のやり取りに対する目的を持つ事が
鍵となる。
要するに、何かが欲しかったり、逆に要らなかったり、
そういう自身の状況や状態について周囲へ表現する行為を、
自ら目的として実行しようとすることである。
それは内から発せられる欲求の表現であり、周囲からの働きかけに対する反応である。

---------------
で、認識のみの状態での意識の存在に戻るが、
視覚の認識であれば、視覚の変化に対してその視覚について
注意を向ける様子が見られれば、普通に人間はその対象が意識を持っているように感じる。
目の前で指を動かしてそれを目で追うのが見て取れれば、
意識があるように感じるはずである。

音声については、先ほど言った応答の有無ということになるが、
音声の入力に対して出力があれば、認識しているようにも見えなくもないが、
実際はオウム返しのようで認識や意識の存在はないように感じる。

おもちゃで入力された音声をそのまま模倣して発生するというのは
あれは認識を行っていない。

音声の認識は、音声の塊に対して、波長や音質やフレーズ、テンポ、音量などを
分けて知覚することである。

少し頭が疲れたので今日はこの辺で。
現状では、徘徊する人にも意識は確認できるので、
思考や想起というのが無くても意識の確認はできると考えている。
ただ、単に連続した刺激の認識の上にもう少し本能的な機能が
必要な感じもする。
それについては、また後日に。


TOPに戻る