close
プログラミング クラウド Microsoft Azure 情報処理資格 基本情報技術者 IT基礎 応用情報技術者 開発・設計方法 オブジェクト指向 内定者・新人研修 プログラミング基礎 アルゴリズム コンピュータ数学 内定者研修 新人研修 ヒューマンスキル プロジェクトマネジメント プレゼンテーション リーダーシップ 組織マネジメント ネゴシエーション ロジカルシンキング Java UI/UX HTTP JavaScript基礎 情報処理資格 ネットワークスペシャリスト ネットワーク インターネットルーティング応用 IPアドレス データベース応用 SQL応用 パフォーマンスチューニング データベース設計 ER図 概念設計(データベース) 論理設計(データベース) IT資格 Linux基礎 OS・システム基盤 セキュリティ TCP/IP OSI参照モデル データベースセキュリティ ファイアウォール 標的型攻撃 SQLインジェクション ネットワーク基本設計 CCNA Cisco プロジェクトマネジメント資格 情報処理資格プロジェクトマネージャ 情報処理安全確保支援士 人事給与 財務会計 管理会計 簿記 生産管理 在庫管理 ERP バランススコアカード 情報処理資格 ITアーキテクト 情報処理資格 ITストラテジスト 情報処理資格 ITサービスマネジメント 情報処理資格 システム監査 PMBOK® PMP® プロジェクト計画 WBS リスクコントロール ITIL ITサービスマネジメント 要求定義 要件定義 見積手法 ビジネスインダストリ 業種・業界知識 業務知識 提案力 ソフトウェアテスト基礎 情報処理資格 データベーススペシャリスト ハードウェア基礎 外部設計(基本設計) 内部設計(詳細設計) データベース基礎 SQL基礎 RDBMS 物理設計(データベース) C++ Ruby MVC基礎 Webアプリケーション開発 JavaEE Javaプログラミング応用 フレームワーク MVC応用 Spring フレームワーク ソフトウェアテスト応用 テスト手法 Junit スマートフォンアプリ開発 Androidアプリ開発 C# 基礎 C# 応用 負荷テスト Javaプログラミング基礎 ソフトウェアテスト コーチング メンタリング HTML/CSS サーバー構築 仮想化技術 KVS (NoSQL) アジャイル スクラム ファシリテーション C言語 ITパスポート JSTQB データサイエンス 単体テスト ユニットテスト キャリアアップ インターネットルーティング基礎 パケット解析 LAN構築 データベース データサイエンティスト トレンド 障害対応 インフラ監視 HTTP/2.0 コンピュータサイエンス VPN ネットワーク物理設計 データベース障害 JavaScript モダンJS (Modern JavaScript) 応用 MVS応用 バックアップ/リカバリ 分散処理 Hadoop Hive Python AI 深層学習(DeepLearning) CentOS Linux応用 Zabbix シェルスクリプト Infrastructure as Code Windowsサーバー基礎 内部設計 Docker DevOps Windowsサーバー応用 NginX chef Ainsible ロジカルライティング R テスト自動化 Jenkins Git 継続的インテグレーション (CI) バージョン管理 Vagrant 要求分析 Redmine 継続的インテグレーション(CI) 継続的デリバリー (CD) ヒューマンリソース管理 Web API マイクロサービス コミュニケーション 業務知識/業界知識 マーケティング 語学 AWS 法務 IoT ビジネスマナー OJT 業務効率化 表計算ソフト オフィスソフト コンプライアンス フロントエンド Subversion PHP 関数型プログラミング Laravel モダンJS (Modern JavaScript) 基礎 Android Studio 機械学習 iOSアプリ開発 ぷプログラミング React 次世代高度IT人材 共創 IPA Raspberry Pi Xamarin スクリプト言語 GoF CUI VBA 資格 ビジネス文書 jQuery 研修参加レポート マネジメント OSPF テーブル設計 アンガーマネジメント クリティカル・シンキング PDU 経営改善 Pマーク 問題解決技法 サイバー攻撃 エンジニア 参加してみた エンゲージメントマネジメント 労働関連法 新人育成 ネットワーク構築 情報セキュリティマネジメント デザインパターン リファクタリング マルチスレッドプログラミング ベンダーコントロール Modern JavaScript 冗長化 VLAN インフラエンジニア チームビルディング テストケース リーダブルコード セキュリティ入門 ネットワーク入門 Node.js npm gulp ビルドツール Python入門 冗長化入門 インフラ実機演習 プロジェクト管理 Active Directory ネットワーク管理 コンテナ 正規化理論 Haskell 品質管理 OpenStack シンギュラリティ DBA中級 プロトコル UX 基本設計 FinTech トラブルシューティング 並列処理 見える化 PMO ロジカルコミュニケーション Deep Learning インデックス設計 超上流工程 BGP Excel C-CENT Selenide プライベートクラウド アセンブラ コンピュータ基礎 工数見積 CCENT 法律知識 失敗から学ぶ プロジェクト失敗事例 PDCA プログラミング入門 非エンジニア向け 4Biz DNS セルフマネジメント 片付け術 サーバーダウン サーバー タイムマネジメント GO言語 プロダクトマネジメント プロダクトマネージャ LVS ロードバランサー 負荷分散 仮想通過 犯罪心理学 情報漏えい SEカレッジ導入事例 IT研修を聞いてみた 会社規模 (100~300名) IT研修制度を聞いてみた CentOS7 開発環境構築 数字力 財務 IT人材 UI Machine Learning Go言語 (golang) データマイニング 統計学 新人教育 やり直し数学 RDB つながる工場 モチベーション WebSocket WebWorker HTML5 CSS3 Bootstrap 微分・積分 システム設計 決断力 LAMP環境 トレ担 教育研修担当者向け ルーティング Linux入門 図解術 目標設定 試験対策 インタビュー技法 Vue.js ブロックチェーン 会社規模 (~50名) DHCP 仕掛け学 BSC 財務諸表 自己分析 RIP スタティックルート バッファオーバーフロー DoS攻撃 システム開発 会社規模 (~99名) Wireshark パケットキャプチャ 管理職研修 部下育成 ワークあり 文章力 情報システム部門向け プロジェクトリーダー プロジェクトマネージャ 塗り絵 リスク管理 法改定 会社の仕組み Chainer AI人材 会話術 会社規模 (~25名) テスト技法 組織規模 51名~99名 組織規模:~199名 [組織規模]199名まで 組織規模 199名まで 組織規模199名まで 会社規模199名まで 会社規模49名まで 会社規模99名まで アプリ開発 サーバサイドJava 営業知識 Cloud 栄養学 基本コマンド ウォーターフォールモデル ヘルスケア 論理設計 ニューラルネットワーク ハンズオン UML 顧客ヒアリング マウスで学ぶ Apache EC2 Lightsail M5Stack DevSecOps プロジェクト成果 画像認識 チャットポット コマンド レビュー 基本用語 自動構築 LPIC-1 サーバーサイドJavascript キャリア形成 ワークライフバランス インバスケット テック用語 GitHub Windows エディタ 教養 令和時代 RESTful API 物理設計 会社規模300名以上 データモデリング サーバーサイドJava Webサーバー基礎 Webサーバー応用 Watson IBMWatson Learning Topics OS モバイル コンテスト トレーニング手法 アーキテクチャ 人材モデル インフラ CI/CD Infrastructure as a Code チーム開発 制度づくり Special_Intro AI市場分析 研修ロードマップ 仕事術 デジタルトランスフォーメーション 財務分析手法 情報整理 PowerPoint 新しい研修 オンライン研修 見どころ紹介 統計分析 ディープラーニング G検定 情報処理技術者試験 販売管理 C# テスト計画 Linuxサーバー WEBサーバ構築 http/2 Postfix イーサリアム プロジェクト・メンバ 正規化 パケット実験 作業分解

3時間で学ぶ!AI・機械学習 入門 研修コースに参加してみた


2020-06-26 更新

今回参加したコースは 3 時間で学ぶ! AI・機械学習です。

「 AI や 機械学習 ってどんなものか教えて?」と IT 以外の業界のご友人もしくはご家族から質問されると、皆さんはどのように説明されますか?

私はゴニョゴニョ言っておしまいにすると思います!

このコースでは、そんな「なんとなくは知っているけれど、実際のところはよくわかっていない」AIや機械学習について、体系的にわかることはもちろん、ちょっとした機械学習のアルゴリズムから開発の進め方まで「チョットワカル」と言えるようになるものでした!

では、コースの内容をレポートします!!

コース情報

想定している受講者 AI についてはじめて学ぶ人
受講目標
  • AI についての基礎知識の習得
  • 機械学習についての基礎知識の習得

講師紹介

登壇されたのは、この参加してみたレポートでは初めてのご登場、植田 崇靖さん です。

コースの中ではスライド 1 枚 2 行で、とてもアッサリと自己紹介されたのですが、そのスライドには一つだけ動画が紹介されていました。植田さんが開発されたのですが、これがまた面白いものでした!

人間の動きに合わせて、台車が追従するのです。いやいやスゴイ。

ちなみに、SEカレッジでは植田さんに 2 つの IoT のコースをお願いしており、いずれも人気です!

 

今日のコースは、決定木やランダムフォレストなど機械学習アルゴリズムを詳しく扱うのではなく、どのようにデータ分析するのか、その流れを GUI で簡単にできるツールを紹介します、ということでスタートしました。

AI(人工知能)とは

まずは、「そもそも人工知能とは何か」という解説です。

  • 人工知能とは
    • 人間の知能そのものを機械で作る
    • 人間が知識を使ってすることを機械にさせる (単機能)
      • 画像の中から指定されたものを抽出
      • 自然言語 OCR 、理解、音声化・発話(スマートスピーカーや音声アシスタントなど)
    • 画像認識系の利用、投資が大きい

音声、言語処理などなど、いっぱいある AI の分野の中でも、画像認識の市場が大きいとはちょっと知らなかったです。

AIの歴史

続いて、AI の歴史が紹介されました。これまでの他の AI に関する研修参加レポートでも触れていますが、現在は「第 3 次 AI ブーム」です。

  • 第 1 次 AI ブーム
    • 1950 年代後半~ 1960 年代
    • 推論・探索が研究の中心
      • ゲームやパズルを解く(トイプログラム)
      • チューリングテスト(人間が相手からの応答を「機械によるものである」と見極められるかを試すテスト。AI の完成度を測るバロメーターとされる)
    • 当時は、PC が低性能だったため、現実の複雑な問題は解けなかった → ブーム終息

第 1 次 AI ブームの頃によく用いられていたアルゴリズムの 1 つである、「探索木」も紹介されました。

  • 第 2 次 AI ブーム
    • 1980 年代
    • (専門家の)「知識」を入れる
    • エキスパートシステム
      • 専門家の意志決定をコンピュータで模倣することを目指す
      • ex. MYCIN: 簡単な質問を繰り返し、細菌をあてる
      • 69 % の精度 (専門家で 80 % )
    • どのように知識を記述するのかが難しい
    • 増え続けるデータの管理が困難(記憶容量の制約)
    • 1995 年頃に終息
  • 第 3 次 AI ブーム(現在)

現在の AI は、音声認識、画像認識やレコメンドなどに加えて、たとえば、感性処理 (言葉などから喜怒哀楽(感情)の判別 ) など様々に活用されています。

機械学習の基礎

機械学習とは? をざっくり解説いただきました。

  • センサーなどで収集したデータからパターンを見つけて推論する研究
  • 機械学習は AI の中の一つ
    • 深層学習 (ディープラーニング) はその中の一つ
  • 機械学習をデータの種類によって分類
    • 教師あり、教師なし
      • 答え (ラベル) があるかどうか
  • 機械学習を問題の解決によって分類
    • 回帰分類
    • クラスタリング
  • 機械学習のプロジェクトのほとんどは教師ありのデータを使って、回帰や分類する仕事

教師あり、教師なし学習

先に紹介頂いたものを、掘り下げていきます。

  • 教師あり
    • 気温とアイスの過去の売上から、アイスの売上を予測する
      • アイスの売上がラベルデータ
      • 傾向を分析する
      • これは回帰
    • たくさんの犬の写真から、たくさんの動物が写った写真から犬を特定する
      • 犬の写真がラベルデータ
      • 分類する方法を分析する
      • これは分類
    • 乳がんの検査はどっち?
  • 教師なし
    • ラベルがないデータから特徴を見出して分類する
    • クラスタリング
  • どちらでもないのが強化学習
    • 失敗したら罰を与えることによって、学習が補正される

ここでこの強化学習について、その驚異的な学習スピードがわかる動画を紹介頂きました。(植田さん、いちいち印象に残りやすい)

  • インベーダゲーム
    • ボールを打ち返すところが最初はランダム
    • ボールを落とすと罰を与える
  • 自動運転
    • 道路を画像認識させる
    • ハンドルやアクセルをランダムで操作

機械学習のアルゴリズム

続いて、機械学習でよく用いられるアルゴリズムが紹介されました。

ただ、ここで植田さんから大正コソコソ噂話ならぬ、現場話が差し込まれました。

「開発においては、ほどんどアルゴリズムの中をいじることはない」
「パラメータや変数をちょっと編集するだけ」

ナント!

ただし、「どんなアルゴリズム ( = 解決法) があるのか知っていて、それを問題に合わせて使えることが重要です」というお話でした。

ということで、どんなアルゴリズムがあるのか、決定木、ロジスティック回帰、k近傍法などなど解説いただいたのですが、ここでは抜粋して紹介します。

  • ランダムフォレスト
    • 分類や回帰で使う
    • 決定木を多数作って多数決または平均値
  • サポートベクターマシーン
    • 一番良く使われる
    • 分類や回帰どちらでも使われる
    • データをわける線 (曲線直線問わず) を 2 つ作る
      • それぞれのデータから等距離にあるものを割り出す
  • ニューラルネットワーク
    • 脳のニューロンがモデル
    • 様々な入力を受け取り、なんらかの重み付けをしながら次の層に出力
  • ディープラーニング
    • 3 層以上のニューラルネットワークが重なったもの
    • ある画像認識コンテストでトロント大が採用して優勝した
    • 行列計算で行なっている = 3 次元 ( x, y, z ) 処理が速い GPU が効く
    • CNN 畳み込みネットワーク
      • 画像
    • RNN
      • 多次元

機械学習の特徴

アルゴリズムに関わらず、機械学習のプロジェクトには共通点があります。

  • 学習は時間がかかる
  • (学習が終われば)予測は一瞬
  • 深層学習(ディープラーニング)は教師ありなしなど関係がない
  • ただしディープラーニングは計算量がハンパない

そのほか、機械学習とあわせて使われる統計とその手法について、機械学習とはそもそも目的が異なること、使いみちも触れていただきました。

機械学習を使った開発の進め方

続いて、機械学習を使ってどのように開発するのか、実際の演習ケースをもとに、その流れを紹介いただきました。

  1. データの準備
    • 収集するデータの検討
    • データの収集
      • この工程が後に影響してくる (ここで失敗すると、すべて失敗する)
      • どのデータを利用するか、が非常に重要
      • どのデータが最終的な結論に結びついているかをしっかりヒアリング
      • マンパワーの 8 割くらいがここにかかる
  2. 手法の選択
    • 機械学習の手法(アルゴリズムなど)の選定
    • 基本は全部やって、作ったモデル同士を比べる
  3. 前処理
    • 必要なデータの選別
      • 相関が強くないデータは使わないことが多い
    • データラングリング(データクリーニング、データクレンジング)
      • 何らかの影響でデータが欠損したり異常値がある → 適当な数値(平均値など)を入れたり項目自体を削除
    • データ拡張
      • 画像データを扱う場合に実施することが多い
      • 既存のデータを加工(画像処理など)して増やすこともあるが問題が多いので、あまりやらない方がよい
    • データ分割
      • トレーニングデータ
      • 評価データ(今回は使用しない)
      • テストデータ
      • トレーニングデータの 90 % をモデル用、トレーニングデータの 10 % をテストデータとする
  4. モデルのトレーニング
    • 学習
  5. モデルの評価
    • アルゴリズムを利用してモデルを作り、精度をチェックして最適なものを選ぶ
  6. 納品、運用
    • デプロイ -> Web API のように使う

このあと、自身の PC を使ってローカルで開発するときに使うツール or クラウドを使って開発するときのツールを紹介頂きました。

ローカル PC で開発
Python や Anaconda 、また Python の NumPy, Scikit-learn やディープラーニングの Tensorflow などのライブラリを使用 (ここでは割愛)

クラウドサービスでのデータ分析

続いて、クラウドサービスについていくつか紹介頂いたのですが、私があまり知らなかったものを、ここでは紹介します。

このコースでは、先のケースで出てきたデータをもとに、MatrixFlow を使って植田さんにデモして頂きました。

  • MatrixFlow
    • ノンプログラミングで使える
    • レシピ(モデル)が用意されている
    • 最適なアルゴリズムとパラメータの組み合わせを簡単に探せる
    • 推論には推論用データ(プレディクトデータ)を使用
    • メールアドレスとパスワードの登録で利用可能
    • 無料版はアルゴリズムを選べない

Python のコードが一つも出てこず、PoC の前段階として使えるかなぁ、という印象を受けました。

講義の最後に、 AWS 、 GCP 、Azure にも、機械学習サービスがあることを紹介して、このコースは修了しました。

まとめ

このコースでは、タイトルの通り 3 時間で AI や機械学習について、その全体像がわかりました。

体系的にまとめて頂いたことと、動画やデモを交えて頂いたので、あまり難しいと感じることもなく、また座学でもあまり退屈に思うことはありませんでした。

また、植田さんが開発されていることもあって、実際に現場で行われていることを、チョイチョイ紹介頂くので、それが刺激的でした。

これで私も家族や友人に、いい感じに説明できそうです!

 


SEカレッジについて

label SEカレッジを詳しく知りたいという方はこちらから !!

SEcollege logo
SEカレッジ
IT専門の定額制研修 月額28,000円 ~/ 1社 で IT研修 制度を導入できます。
年間 670 講座をほぼ毎日開催中!!

特集・キャンペーン

午前免除 FAQ

タグ一覧