close
プログラミング クラウド Microsoft Azure 情報処理資格 基本情報技術者 IT基礎 応用情報技術者 開発・設計方法 オブジェクト指向 内定者・新人研修 プログラミング基礎 アルゴリズム コンピュータ数学 内定者研修 新人研修 ヒューマンスキル プロジェクトマネジメント プレゼンテーション リーダーシップ 組織マネジメント ネゴシエーション ロジカルシンキング Java UI/UX HTTP JavaScript基礎 情報処理資格 ネットワークスペシャリスト ネットワーク インターネットルーティング応用 IPアドレス データベース応用 SQL応用 パフォーマンスチューニング データベース設計 ER図 概念設計(データベース) 論理設計(データベース) IT資格 Linux基礎 OS・システム基盤 セキュリティ TCP/IP OSI参照モデル データベースセキュリティ ファイアウォール 標的型攻撃 SQLインジェクション ネットワーク基本設計 CCNA Cisco プロジェクトマネジメント資格 情報処理資格プロジェクトマネージャ 情報処理安全確保支援士 人事給与 財務会計 管理会計 簿記 生産管理 在庫管理 ERP バランススコアカード 情報処理資格 ITアーキテクト 情報処理資格 ITストラテジスト 情報処理資格 ITサービスマネジメント 情報処理資格 システム監査 PMBOK® PMP® プロジェクト計画 WBS リスクコントロール ITIL ITサービスマネジメント 要求定義 要件定義 見積手法 ビジネスインダストリ 業種・業界知識 業務知識 提案力 ソフトウェアテスト基礎 情報処理資格 データベーススペシャリスト ハードウェア基礎 外部設計(基本設計) 内部設計(詳細設計) データベース基礎 SQL基礎 RDBMS 物理設計(データベース) C++ Ruby MVC基礎 Webアプリケーション開発 JavaEE Javaプログラミング応用 フレームワーク MVC応用 Spring フレームワーク ソフトウェアテスト応用 テスト手法 Junit スマートフォンアプリ開発 Androidアプリ開発 C# 基礎 C# 応用 負荷テスト Javaプログラミング基礎 ソフトウェアテスト コーチング メンタリング HTML/CSS サーバー構築 仮想化技術 KVS (NoSQL) アジャイル スクラム ファシリテーション C言語 ITパスポート JSTQB データサイエンス 単体テスト ユニットテスト キャリアアップ インターネットルーティング基礎 パケット解析 LAN構築 データベース データサイエンティスト トレンド 障害対応 インフラ監視 HTTP/2.0 コンピュータサイエンス VPN ネットワーク物理設計 データベース障害 JavaScript モダンJS (Modern JavaScript) 応用 MVS応用 バックアップ/リカバリ 分散処理 Hadoop Hive Python AI 深層学習(DeepLearning) CentOS Linux応用 Zabbix シェルスクリプト Infrastructure as Code Windowsサーバー基礎 内部設計 Docker DevOps Windowsサーバー応用 NginX chef Ainsible ロジカルライティング R テスト自動化 Jenkins Git 継続的インテグレーション (CI) バージョン管理 Vagrant 要求分析 Redmine 継続的インテグレーション(CI) 継続的デリバリー (CD) ヒューマンリソース管理 Web API マイクロサービス コミュニケーション 業務知識/業界知識 マーケティング 語学 AWS 法務 IoT ビジネスマナー OJT 業務効率化 表計算ソフト オフィスソフト コンプライアンス フロントエンド Subversion PHP 関数型プログラミング Laravel モダンJS (Modern JavaScript) 基礎 Android Studio 機械学習 iOSアプリ開発 ぷプログラミング React 次世代高度IT人材 共創 IPA Raspberry Pi Xamarin スクリプト言語 GoF CUI VBA 資格 ビジネス文書 jQuery 研修参加レポート マネジメント OSPF テーブル設計 アンガーマネジメント クリティカル・シンキング PDU 経営改善 Pマーク 問題解決技法 サイバー攻撃 エンジニア 参加してみた エンゲージメントマネジメント 労働関連法 新人育成 ネットワーク構築 情報セキュリティマネジメント デザインパターン リファクタリング マルチスレッドプログラミング ベンダーコントロール Modern JavaScript 冗長化 VLAN インフラエンジニア チームビルディング テストケース リーダブルコード セキュリティ入門 ネットワーク入門 Node.js npm gulp ビルドツール Python入門 冗長化入門 インフラ実機演習 プロジェクト管理 Active Directory ネットワーク管理 コンテナ 正規化理論 Haskell 品質管理 OpenStack シンギュラリティ DBA中級 プロトコル UX 基本設計 FinTech トラブルシューティング 並列処理 見える化 PMO ロジカルコミュニケーション Deep Learning インデックス設計 超上流工程 BGP Excel C-CENT Selenide プライベートクラウド アセンブラ コンピュータ基礎 工数見積 CCENT 法律知識 失敗から学ぶ プロジェクト失敗事例 PDCA プログラミング入門 非エンジニア向け 4Biz DNS セルフマネジメント 片付け術 サーバーダウン サーバー タイムマネジメント GO言語 プロダクトマネジメント プロダクトマネージャ LVS ロードバランサー 負荷分散 仮想通過 犯罪心理学 情報漏えい SEカレッジ導入事例 IT研修を聞いてみた 会社規模 (100~300名) IT研修制度を聞いてみた CentOS7 開発環境構築 数字力 財務 IT人材 UI Machine Learning Go言語 (golang) データマイニング 統計学 新人教育 やり直し数学 RDB つながる工場 モチベーション WebSocket WebWorker HTML5 CSS3 Bootstrap 微分・積分 システム設計 決断力 LAMP環境 トレ担 教育研修担当者向け ルーティング Linux入門 図解術 目標設定 試験対策 インタビュー技法 Vue.js ブロックチェーン 会社規模 (~50名) DHCP 仕掛け学 BSC 財務諸表 自己分析 RIP スタティックルート バッファオーバーフロー DoS攻撃 システム開発 会社規模 (~99名) Wireshark パケットキャプチャ 管理職研修 部下育成 ワークあり 文章力 情報システム部門向け プロジェクトリーダー プロジェクトマネージャ 塗り絵 リスク管理 法改定 会社の仕組み Chainer AI人材 会話術 会社規模 (~25名) テスト技法 組織規模 51名~99名 組織規模:~199名 [組織規模]199名まで 組織規模 199名まで 組織規模199名まで 会社規模199名まで 会社規模49名まで 会社規模99名まで アプリ開発 サーバサイドJava 営業知識 Cloud 栄養学 基本コマンド ウォーターフォールモデル ヘルスケア 論理設計 ニューラルネットワーク ハンズオン UML 顧客ヒアリング マウスで学ぶ Apache EC2 Lightsail M5Stack DevSecOps プロジェクト成果 画像認識 チャットポット コマンド レビュー 基本用語 自動構築 LPIC-1 サーバーサイドJavascript キャリア形成 ワークライフバランス インバスケット テック用語 GitHub Windows エディタ 教養 令和時代 RESTful API 物理設計 会社規模300名以上 データモデリング サーバーサイドJava Webサーバー基礎 Webサーバー応用

マウスで学ぶ AI (機械学習) 入門編 研修コースに参加してみた

今回参加した研修コースは マウスで学ぶ AI (機械学習) 入門編 です。

AI がテーマなので、コースは当然ながら満員です !!!

さて、機械学習やAIの動画やネット記事を見て、モヤモヤすることは感じませんでしょうか? 特に Python や数式です… 私は間違いなく数式のところで、そっ閉じしてます。

このコースでは、ナント、マウスでポチポチ操作すると学習モデルが作る体験ができる のです。

この Azure ML Studio を使って、実際に学習モデルを作ってみたのですが、開発の流れやどんなことをやるのかというのがわかり、モヤモヤが晴れました!

AI が気になる方、これはITエンジニアに限らずビジネス職の方も含め、AI、機械学習に興味のある方におすすめです!

では、どんな内容だったのかレポートします!!

コース情報

想定している受講者 「AIのこれまでとこれから」を受講、またはAIに関する基礎知識をお持ちの方
受講目標
  • 機械学習の具体的なプロセスを理解する
  • 訓練データやテストデータの準備方法について理解する
  • 開発したAI(学習済みのモデル)の評価手法を理解する
  • 既存システムにAIを組み込む方法を理解する
  • 回帰、分類、クラスタリングの考え方を理解する

AIのこれまでとこれから
研修コースに参加してみた

講師紹介

登壇されたのは 大石 宏一さん です。

大石 宏一
大石 宏一
AIをはじめプログラミング/ソフトウェアテスト/PMなど幅広く、かつ現場で使える知識と技術にこだわる人気トレーナー

大石さんが所属するクロノスでは4~5年前からAIに取り組み、AIに関する製品を3つ開発してらっしゃるとのこと。

 

ちなみに TechCrunch というメディアでも取り上げられた「Tokyo AI Map」にクロノスさんは載っています。

また大石さんをはじめクロノスさんには、このコースにあわせて Azure ML Studio の準備や、データセットをご用意いただき、つまづくことなくスムーズに学習を進められました。本当にありがとうございます!!

今日の狙い

講師紹介のあと、このコースの狙いを説明いただきました。

  • 機械学習の仕組みはわかったんだけど、ちょっと実感がわかない
  • 仕組みを作ろうとするとスグに Python などプログラミングになってしまう
  • それがマウス操作だけで機械学習の学習モデルを作る体験ができる
  • ただし、このコースはいつも6時間の内容なので、今回はかなり短縮

機械学習とは

まずは機械学習とは何かおさらいします。

  • 今は第3次AIブーム
    • 第2次では出来なかった技術の発展があった
      • データ収集
      • データストレージ
      • 処理能力
      • アルゴリズム
    • いわゆる「Googleの猫」がキッカケ
  • 機械学習の手法
    • 線形回帰など昔から手法はある
    • ニューラルネットワークの DeepLearning が新しい手法

教師あり教師なし学習

  • 教師あり
    • 答えがあるデータがセットにして学習する
    • 分類と回帰に使える
      • 分類: 学習済みデータから出された値を判定する
      • 回帰: 連続した値から次の値を予測する
  • 教師なし
    • 答えも特になく、ただデータを学習し、特徴を出す
      • ただし、なぜそうなるのかがわからない…
    • クラスタリングに使える
      • 分類との違い: データをグループにすること
  • 強化学習というやり方が出てきている
    • データを + / – の報酬で学習して学習モデルを作る
    • QL (Q learning) と呼ばれる
      • ディープラーニング (Deep Learning) と組み合わせて DQN と呼ばれる
      • ディープラーニング (Deep Learning) で認識し、QLで判断する
      • ただし判断は人間がしましょう、というのが今のAI

判断を人間がするというのは倫理的な問題もあるとのことでした。たしかにUberの自動運転の事故のようにAIの責任なのか、人間の責任なのか、なかなか難しいことになりますよね。

訓練データとテストデータ

  • 訓練データ
    • 学習モデルを作る上で使うデータ
  • テストデータ
    • 作った学習モデルをテストするデータ
  • 過学習
    • よく使う言葉
    • 訓練データにだけ強くなってしまう
    • 精度が悪くなるタイミングまでやる、という使い方もあり

機械学習の流れ

  1. データの前処理
    • (1)収集 -> (2)欠損処理 -> (3)スケーリング処理 -> (4)訓練データとテストデータの分割
      • AIの大きな失敗パターンの1つがデータが無い問題
        • データは1万件ぐらい欲しい
      • 逆にデータがあっても目的がないのが大きな失敗パターンの1つ
    • (1)データ収集
      • オープンデータを使うこともできる
    • (2)欠損値処理: データが欠落しているときにどう処理するか
      • 3つのやり方がある
        • 欠損値があったらデータから除外
        • 平均値を入れる
        • デフォルト値を入れる
      • データ1件1件にこの判断をしなくてはいけない (無理ゲーだ…)
    • (3)スケーリング
      • そのまま学習してもいいんだけど処理負荷が高いため単純な値で置き換える
  2. モデルの学習
    • 学習で使うアルゴリズムを選択する
    • パラメータを設定する
      • 学習しながら自動設定する or 自分で設定する
  3. 学習済みモデルの評価
    • テストデータで検証することをホールドアウト検証という
    • ただ多くはデータが少ないので、別のやり方がある
      • k分割交差検証: 訓練データを4分割して一部をテストデータに使う
    • 教師あり学習では accuracy (正答率) などを参考にする
      • accuracy だけでは判断できないことがあるので注意
      • 教師なし学習は主にクラスタリングに使うので accuracy ではない指標を使う
  4. 学習モデルの利用
    • Web API のように使う

データがなくても、データがあっても失敗する。なかなかに難しいものですが、リスクを取らなければ果実は得られない、ということですね。

以前にもバズった記事がありましたが、そこでは失敗してから、ようやくユーザが腰を上げて動くようになったとありました。

AzureMLを使う

座学部分を巻きでやりながら、いよいよ Azure Mashine Learning Studio の出番です。ワクワクすぎる!!

なお、クロノスさんにクレンジングされたデータやオープンデータからピックアップ頂いています。圧倒的に感謝です!

回帰問題をやってみましょう

まずは先ほどの機械学習の流れの通り、簡単に モデルの学習 -> モデルの評価 をやってみます。

お題: 数学の点数から物理の点数を予測したい

1. データセットをアップロード

2. 訓練データとテストデータを分割

3. EXPERIMENTSを作成

EXPRIMENTS にデータセットやアルゴリズムを繋げて、学習モデルを作っていきます。

 

アルゴリズムは線形回帰を使い、学習モデルを作ってみました。(ここまでで15分ほど)

4. 実行してみる -> 5. 学習モデルを評価

 

おお!!! 動いて精度が出てます !!! まったくの素人が20分ぐらいで学習モデルを作れました!!! (スゴイAzure ML Studio)

 

なお、この手順はほとんど変わらないので、一度やってみるとだいたい掴めますが、それだけでなくアルゴリズムを Neural Network に変えたり、訓練データとテストデータのしきい値を変える演習もあって、操作に慣れていきます。

  • Neural Network を使う
  • 訓練データとテストデータのパラーメータを変更

パラメータをいじって精度が上がったり下がったり、なーーんにもわかってないのですが、なかなか雰囲気でます。

教師あり学習をやってみましょう

今度は学習済みデータ (クラスタリングされたデータ) を使ってみます。

アヤメの形状と品種のデータから新しいアヤメの品種を判別してみましょう

  1. データセットをアップロード
    • class (品種) というカラムがあることを確認
  2. 1訓練データとテストデータを分割
  3. EXPERIMENTSを作成
    • アルゴリズムはロジスティック回帰 (Two-Class Logistic Regression) を使いましょう
  4. 実行してみる
  5. 学習モデルを評価

 

精度がいい感じです!!

教師なし学習をやってみましょう

今度は学習前のデータをもとにクラスタリングしてみます。

無秩序なアヤメの形状データから2種類に分類してみましょう

  1. データセットをアップロード
    • class (品種) というカラムが無いことを確認
  2. 訓練データとテストデータを分割
  3. EXPERIMENTSを作成
    • アルゴリズムはK-Meansクラスタリングを使いましょう
    • Number of Centroids でグループの数を選択する
    • クラスタリング専用の Train Clustering Model を使う
  4. 実行してみる
  5. クラスタリングされたデータを見る

 

どういうクラスタになったのかはわかりませんが、できた様子です!! (われながら適当すぎるぞ…)

このクラスタリングされたデータをもとに回帰に繋げる、ということでした。そういう風に流れるのですね。なるほどー!

 

この演習で使った K-Meansクラスタリング を補足説明して、このコースは修了しました。

まとめ

このコースでは機械学習を Azure ML Studio を使ってマウスでポチポチしながら機械学習の処理の流れを体験しました。

なかなかページでは伝えきれないものがありますが、モヤっとしていたものがクリアになる感覚がありました。

とはいえ、これでは小並感過ぎる感想なので、もう少し掘り下げると、具体的にどのように開発していくのか、どんなデータを使うのか、訓練データとテストデータをどう結びつけるのか、つくった学習モデルをどう評価するのか、一通り出来た感覚が掴めました !!
(アルゴリズムは… いつか本気出す!?)

大石さんもAzure ML Studioなどでプロトタイプしながら、いい感じの精度になったら実装する、ということを仰っていたので「素早く失敗して、失敗から学ぶ」ということに向いてそうです。

AIの開発、機械学習で結局何をするのか、何から始めるのかといったモヤモヤをお感じの方には、とてもオススメのコースです!!

 

 

label SE カレッジの無料見学、資料請求などお問い合わせはこちらから!!


SEカレッジについて

label SEカレッジを詳しく知りたいという方はこちらから !!

SEcollege logo
SEカレッジ
IT専門の定額制研修 月額28,000円 ~/ 1社 で IT研修 制度を導入できます。
年間 670 講座をほぼ毎日開催中!!

特集・キャンペーン

よくある質問集

タグ一覧

参加してみた研修参加レポート基本情報技術者Linux基礎Javaセキュリティプログラミングオブジェクト指向ネットワークプロジェクトマネジメントPythonAISQL基礎ヒューマンスキルプログラミング基礎資格コミュニケーションLinux入門IoTデータベースプログラミング入門テーブル設計仮想化技術エンジニアC# 基礎アルゴリズムSQL応用マネジメントビジネスマナーJavaScriptソフトウェアテストパケット解析シェルスクリプトLAN構築PMBOK®ビジネス文書コンテナjQueryLinux応用データサイエンスサーバー構築ファイアウォール問題解決技法プレゼンテーション障害対応データベース基礎AWSデザインパターンRDBMS情報処理資格教育研修担当者向け工数見積ヘルスケアプロジェクトマネージャWindowsサーバー基礎テック用語DNSVLANER図Dockerネットワーク入門要求定義プロトコル応用情報技術者機械学習ロジカルライティングSEカレッジ導入事例簿記テスト自動化C# 応用ロジカルコミュニケーションPマークサーバサイドJavaIT研修制度を聞いてみたRaspberry PiIT基礎Cloud図解術プロジェクト管理新人研修品質管理試験対策単体テスト財務トレンドJavaプログラミング基礎アンガーマネジメントベンダーコントロールコーチングGoFJavaプログラミング応用ロジカルシンキングデータベース設計ExcelインフラエンジニアアジャイルTCP/IP営業知識UIインフラ実機演習ネットワーク構築インデックス設計非エンジニア向けテストケース見える化WBS決断力法律知識Modern JavaScriptLVSITパスポートHTML5パフォーマンスチューニングデータベースセキュリティRDBActive DirectoryCSS3CentOS7データサイエンティストセキュリティ入門フレームワークリファクタリングコマンドマルチスレッドプログラミングCCNAスクラムJavaScript基礎管理職研修情報漏えいクラウドサーバーHTML/CSS令和時代CentOSLAMP環境OSPFVPNITILネットワーク管理Git物理設計(データベース)Python入門SQLインジェクションセルフマネジメントZabbixルーティング新人育成リスク管理サイバー攻撃DevSecOps犯罪心理学正規化理論Webアプリケーション開発論理設計JavaEE法改定DHCP経営改善ロードバランサー基本コマンドBGPエンゲージメントマネジメント会社規模99名までプロジェクト失敗事例システム開発データベース障害関数型プログラミング統計学Deep LearningPDCAUI/UX微分・積分プロダクトマネジメントソフトウェアテスト基礎Vue.js片付け術マーケティングクリティカル・シンキングプロジェクト計画マウスで学ぶバージョン管理プロダクトマネージャ開発環境構築Cisco内定者研修ブロックチェーン要件定義JunitUX情報セキュリティマネジメント冗長化次世代高度IT人材会社の仕組みLPIC-1PHPOS・システム基盤UMLサーバーサイドJavascriptウォーターフォールモデルM5StackWindowsトラブルシューティング顧客ヒアリングキャリア形成DBA中級Windowsサーバー応用業務効率化データベース応用テスト手法HTTPシステム設計CCENTリーダーシップワークライフバランス論理設計(データベース)基本用語表計算ソフトOSI参照モデルプロジェクト成果Machine LearningIT資格塗り絵HTTP/2.0栄養学目標設定会社規模199名までPMO失敗から学ぶWeb API財務諸表ビジネスインダストリインターネットルーティング応用文章力自己分析GO言語情報システム部門向け会社規模49名までモチベーションインタビュー技法OJTIPアドレスインターネットルーティング基礎ITサービスマネジメント仮想通過IPAAI人材IT人材MVC基礎レビュー新人教育チームビルディングエディタパケットキャプチャ会話術並列処理スタティックルートモダンJS (Modern JavaScript) 基礎データモデリングインフラ監視WebWorkerSelenidechefサーバーダウンnpmスクリプト言語やり直し数学Infrastructure as Code教養Haskellテスト技法PDUApache継続的インテグレーション(CI)ネゴシエーションインバスケットバッファオーバーフローサーバーサイドJava財務会計ニューラルネットワークプライベートクラウド自動構築gulpフロントエンド超上流工程見積手法画像認識4Bizリーダブルコードアプリ開発Go言語 (golang)リスクコントロールMicrosoft AzureEC2DoS攻撃Webサーバー基礎数字力基本設計ハンズオンアセンブラタイムマネジメントビルドツールOpenStackつながる工場内部設計チャットポットRESTful APIデータマイニングLightsailGitHub負荷分散共創Webサーバー応用ChainerFinTechBootstrapコンピュータ基礎シンギュラリティ労働関連法提案力物理設計業務知識/業界知識ソフトウェアテスト応用WiresharkPMP®継続的インテグレーション (CI)RIP冗長化入門Laravel概念設計(データベース)プロジェクトリーダーWebSocketC-CENTコンピュータ数学Node.js会社規模300名以上

過去の記事