AIと括られると人は不安や思考停止に陥りますが
何か違う世界のSF映画の中で行われている未知の物と言う感覚ですが。
実際は身近にあふれ出しています。
AIの基本は「認識」と「学習」になります。
ここを混同しがちですが
脳の中で言うと「判断しながら学習して最適値を導く」なので、括りは一緒ですが別の物になります。
「認識」について
「認識」と言っても人間であれば五感(第六感もありますが)
五感とは視・聴・嗅(きゅう)・味・触の五つの感覚
この五感の中で現在コンピュータに出来るのは視覚と聴覚になります。
「画像認識」「音声認識」「文章認識」に層別できます。
それぞれは身近になって来ましてよね。
「Hey Sri 音楽かけて」「アレクサ エアコン付けて」等が音声認識です。
「外国語翻訳」などは音声認識と文章認識の組み合わせですね。
「画像認識のメカニズム」について学んで行きましょう。
少し歴史をさかのぼってみてみましょう。
FAXにて文字を送る仕組みって考えた事ありますか?
文字や絵が電話回線を通じて送れるって本来凄いと思いませんか?
これは「0,1」のデジタル判断を行い、「0:OFF、1:ON」に置き換えています。
図例を見て下さい「X文字が」色分けしていますが
「白:0、黒:1」で表すと
10000001
01000010
00100100
00011000
00011000
00100100
01000010
10000001
に置き換えられ、これを信号「0:OFF、1:ON」に置き換えてデータとして送り受け取った方が、この信号を「白:0、黒:1」に変換して表示している機能です。
これが全てのベースになります。
例では「8*8マス(64ビット)」ですが、コンピュータの進化で細かな画素と高速でデータを変換する技術が確立でき
これをカラーでも表現する事から始まりました。
画像が数値に変換出来てしまえば、次の処理はコンピュータではお手の物です。
前画像(数値)と後画像(数値)を比較して同じであれば「同じ」変化があれば「違う」と言う判断が出来ます。
これが全ての基本となりますので、先ずはご理解下さい。
ここまでは誰でもある程度は想定できますよね。
しかし、これは単なる「0,1判定」でしかありません。
まだまだ人の脳判断には追い付きません。
そこで次に追及するのが「0.1判定」だけでなく「0に近い0、1に近い1」と言う曖昧判断を行う事が進んだ訳です。
例
「動いている時も同じ物と判断」
「同じ形でも色が違うと違うと判断」
この様な事(データ)をコンピュータに覚えさせて行き、判断材料を大量に集めます。
これが俗に言う「ビッグデータ」です。
この「ビッグデータを学習」判断材料を人が指示しながらパターン化していきます。その「パターン化データ」と判断要素データを比較して判定するのが大きな流れです。
簡単な説明はここまでですが
実際に難しいのが「判断要素」になります、今までであればプログラマーが判断指示をプログラミングしますが、実際は判断要素が多すぎて追いつきません。
そこで登場する考え方が「機械学習」と言う判断になります。
ここは次の章でひも解いてみます。
今回の章は「画像認識」の基礎部分です。
特に何の役にも立ちませんが雑学として抑えてみて下さい。
-PR-