とにかく、ひたすら

普段の生活で考えたことを「とにかく、ひたすら」書きためていきます。主に読書感想、ライフハック、英語学習や野球を扱います。

AIの衝撃 人工知能は人類の敵か

AI(人工知能)と言えばドラクエ?

最近IT技術に関する本を中心に読んでいます。今回はAIに関してです。

AI技術と聞くと、RPGで初めてAIを搭載したドラクエ4で登場した「作戦」の機能を思い出します。「ガンガンいこうぜ」「いのちをだいじに」「みんながんばれ」とかいうアレですね。(ちなみに、私は「みんながんばれ」派でした)

だいたい、こうした本で紹介されるのは、「プロ棋士とコンピュータの戦い」とか「チェス名人にコンピュータが勝った」という例ですが。

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

 

 

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

AIの衝撃 人工知能は人類の敵か (講談社現代新書)

 

 AIって何か

まず、AIとは何かについて、わかりやすく書かれていました。

AIプログラムに何かの仕事をさせて、上手にできたら「よくできたね」と褒め、失敗したら「駄目じゃないか」と叱ることで、うまくいく方法を自分で学習して上達していくというものです。

先ほどのドラクエの例だと、「ガンガンいこうぜ」の作戦だったら、短いターンで敵を倒せれば成功、「いのちをだいじに」だったら、パーティーのHPが大きく減れば失敗といったような感じでしょうか。

 

海馬は記憶だけでなく未来を司る

AIの可能性が注目された事実として例を挙げられていましたが、知りませんでした。

人間の脳の海馬という領域は過去の出来事を保存する領域として有名ですよね。これは私も知っています。

しかし、海馬は、未来を想像するためにも使われるという例を、「海馬を損傷した人は未来のことを想像することもできなくなる」という例を挙げて説明していました。

海馬は、過去の多くの出来事から未来を想像するためにも使われているんですね。これをコンピュータでも実現できないか?というのが、AIの考え方なんですね。

 

シンギュラリティ(技術的特異点)は過激な意見なのか?

一部のエキセントリックな技術者が唱えている「シンギュラリティ」というものについても述べられていました。

超越的な進化を遂げたAIがいずれは暴走し、人類に壊滅的な被害を与える。2045年には人間の知性を超えた存在になる。

ということです。別の本で読みましたが、AIが自身で、より優れたAIを生み出せるようになった時点が、AIが人類を超える瞬間になると書かれていました。

ハリウッド映画でも良くありますが、可能性としてはゼロではない出来事のように思えますね。

 

AIを考える上で避けて通れない「フレーム問題」

倫理的な話を続けて。著者があげていたAIの課題2つ目。

例えば、自動運転をする自動車が、そのまま進むとこちらに向かってくる自動車との衝突が避けられないと判断した場合、同乗者を助けるために、進んでくる車を避けるために、歩道に乗り上げて歩行者を犠牲にして構わないかという問題です。

  • 人数で考える?
  • 身内を守る(この場合、同乗者)
  • 被害を受ける人の特性(年齢、性別)

これを判断するのは、人間でも難しいのに、正解を与えるというのは困難ですね。

この難しい問題に取り組んで、技術の進化を止めるのはもったいないですが、議論は必要な問題だと思います。

 

スポンサーリンク

 

機械学習(マシンラーニング)

コンピュータやロボットのような機械がビッグデータを解析して、そこから「モデル」と呼ばれるある種のパターンを導き出す技術。現代のAIのベースとなるのがこの機械学習。

AI とは、人間の知能をコンピュータが得意とする大規模な数値計算に「巧妙に」置き換えているにすぎないのかもしれません。

 

技術の進化

なるほどと思った部分。

技術が進化する上で人間は、これまでにも自然界のものをそのまま機械で置き換えるのではなく、全く別の人工物に変えて来たという話。例えば、馬を移動手段として使ってきたが、より良い馬の脚を模倣するのではなく、車輪を採用したという例が挙げられていました。

そう考えると、人間の脳を、数値計算に巧妙に置き換えるというのも、飛躍的な進歩を遂げる転換ポイントなのかもしれませんね。

 

日本はAIで世界に勝てるのか 

以前は、日本がHONDAのアシモなど、汎用ヒューマノイドを目指していたが、その際は、欧米から批判を受けていた(時代が追いついていなかった)。そこで日本は工場用のロボットなどにシフトして行って成功を収めているが、今、欧米もアシモのような夢のロボットを目指している。機が熟したから。

一旦、工業用ロボットなどにシフトしてしまい、ソフトウェア開発で遅れをとっていると言われる日本ですが、頑張ってほしいものです。

 

次はこれを読む

人工知能は人間を超えるか (角川EPUB選書)

人工知能は人間を超えるか (角川EPUB選書)

 
人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)

人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)

 
人工知能は人間を超えるか

人工知能は人間を超えるか

 

 

完全独習 ベイズ統計学入門

完全独習 ベイズ統計学入門

 
完全独習 ベイズ統計学入門

完全独習 ベイズ統計学入門

 

 

 

Kindle Paperwhite (ニューモデル) Wi-Fi

Kindle Paperwhite (ニューモデル) Wi-Fi

 
Kindle Wi-Fi、ブラック、キャンペーン情報つきモデル、電子書籍リーダー
 

 

「ビッグデータの正体」でビッグデータを学ぶ

ビッグデータって何?というのを学ぼうと思い「ビッグデータの正体」という本を読みました。正体暴いてやります。

ビッグデータの正体 情報の産業革命が世界のすべてを変える

ビッグデータの正体 情報の産業革命が世界のすべてを変える

 

 

ビッグデータの正体 情報の産業革命が世界のすべてを変える

ビッグデータの正体 情報の産業革命が世界のすべてを変える

  • 作者: ビクター・マイヤー=ショーンベルガー,ケネス・クキエ
  • 出版社/メーカー: 講談社
  • 発売日: 2013/07/05
  • メディア: Kindle版
  • この商品を含むブログを見る
 

 

ビッグデータは限りなくすべてのデータを扱う

大量のデータを扱える技術、環境、ノウハウが培われる以前は、必要最小限のデータを使って、最大の知見を得るという統計学が非常に重要だったようです。

つまり、統計的なサンプリングで一部のデータを使って分析をするということですね。

選挙時の出口調査とか内閣支持率みたいなのはこれですかね。無作為にサンプリングするというのが重要ですね。この「無作為」というのが意外と難しいんだと、本書でも述べられていました。 

それが、コンピュータの計算能力の向上や、データ格納容量の増加、大量データを扱うノウハウ、仕組みが確立してきたことで、「無作為にデータをサンプリングするのが難しいなら、データを全部集めて、全データを分析すればいい!」となったんですね。

量さえあれば精度は重要ではない

全部のデータを扱うとなると、私なんかは、「悪意のあるデータなんかが入ったりするんじゃないの?」「その分析結果って正確なの?信じて判断していいの?」とか考えてしまいます。

それに対してのビッグデータの位置付けとしては、次のように本書では述べられてました。

数字から精度を読み取るのではなく、確率を読み取るのがビッグデータ

正確=メリットという考え方を改める必要がある

反省します。

分析するツールがいくら発達しても、その結果をどのように解釈するかは最終的には人に依存するということですね。

「データは確率的には XXXX という戦略をとる方がうまくいくと示しています。」と言われて判断するこれからの経営者は、ビッグデータに関するある程度の知識が求められそうですね。そうした人に助言できるような、データサイエンティストと呼ばれるような人たちは今後も重宝されるんでしょうね。

 

スポンサーリンク

 

因果関係ではなくて相関関係が重要になる

ビッグデータは相関関係を示すためのもので、因果関係を示すものではないということのようです。

なるほどです。「ロジカルシンキング=因果関係を見つける」と考えがちですが、ビッグデータはそういう類のものではないと理解する必要がありますね。

「XXXX が良いとデータは示しているのはわかったけど、それはなぜ?」という質問をするのはナンセンスなんですね。それに対する答えは、「データがそう言っているから」でしかないということです。  

データのインプットが大事

クズのデータからはクズの結果しか出ない

という引用がありました。

アウトプットしたい内容にふさわしいデータかどうかの見極めが大事なんですね。

これは、先日読んだ下記にも書いていた気がします。 

tossk.hatenablog.com 

ビッグデータを正しく扱える人材、制度が必要

ビッグデータを使う人にはビッグデータを正しく扱うための能力や制度が必要になります。

人間の行動の予測が正確になっていく。実際の行為ではなく、予測される行為で人を判断する誘惑にかられる。

怖いですね。

もし、自分の過去の行動データが、「この人は犯罪を犯す可能性がある」と判断してしまった場合、このデータを扱う人(例えば警察)が、「事件が起こる前に捕まえよう」 と判断してしまったり、それを許すような法制度だとしたら、せっかく世の中を便利にするための技術によって生きにくくなってしまいます。

事前に起こる問題を防止するという点では良いとも考えられますが、ビッグデータはあくまで「起こる可能性がある」ことを示すので、起こった事実ではないですからね。

ビッグデータを正しく扱う制度が必要です。 

ビジネスに役立つデータ分析(R 統計分析)を学ぶ年末

年末で時間があるので、以前から興味があった Rによる統計分析について勉強を始めました。全くの初心者です。新しいプログラミング言語を学ぶのも数年ぶりというレベルです。

下記の書籍を使いましたが、初心者には丁度良い内容でした。

楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人のためのR統計分析入門

楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人のためのR統計分析入門

 

 

 

学ぶより慣れろというモットーという印象を持ちました。

相関分析、クラスター分析、ロジスティック回帰など実際のビジネスで使われる手法を、実際のサンプルデータと、サンプルコマンドを使って学んでいける章立てになっています。

私のような超初心者向けに、統計学の入門についても要所要所で解説してくれています。この本をとっかかりに、Rの入門書や、統計学の入門書にステップアップしていきたいと思います。年始も時間はありますしね。

 

書籍の中では、 環境準備としてWindows 環境へのインストール、セットアップ方法、コマンド実行例が紹介されていますが、私は MAC OS 上で実行しました。

最初のインストールさえしてしまえば、コマンドのよみかえは全く問題ない範囲です。(サンプルデータのパスのよみかえくらい) 

 

スポンサーリンク

 

Rのインストール

下記のサイトで、お使いのMAC OS のバージョンにあったものをダウンロードします。

R for Mac OS X

ファイルをクリックして、お馴染みのインストール画面に従って進めるだけです。

 

Rの起動

ランチャーに表示されているRを実行すると次のような画面が出てきます。これで、本の内容を進める準備は完了です。

 

f:id:toru-ssk:20151231155030p:plain

 

目次

第1章
とっつきにくいけど実はExcel 以上に賢いヤツ
フリー統計解析ソフトウェア「R」を触ってみよう

 

第2章
Rで分析を始める前に
データに異常値がないかを確認しよう

 

第3章
時系列データを分析すると何がわかる?
時系列分析を使ったデータ分解で「変動要因」の特定に挑戦!

 

第4章
Rのパッケージを使って
イケてるグラフをサクッと作成しよう

 

第5章
正しい分析手法を選ばないと時間のムダ
顧客属性とコンバージョンデータを使って、打ち手を効率よく考える

 

第6章
「ダミー変数」でデータをまとめてクラスター分析
単位が違うデータは「標準化/基準化」でGo!

 

第7章
どれだけ○○したら◎◎できるのか?
数値による定量化で「因果関係」を分析する

 

第8章
総まとめ!
コンバージョンに影響を与えたコンテンツは何かを分析してみよう

 

付録
豊澤栄治(ロックオン)×井端康(アトラエ)
ツールを使いこなすだけでなく、さらに高いレベルを目指したい。

 

スポンサーリンク