G検定で学ぶ AI の体系と基礎知識 「オンライン」研修コースに参加してみた

今回参加したコースは G検定で学ぶ AI の体系と基礎知識 です。
最近はニュースなどで、 AI という言葉を聞かない日はありません。 G検定 というのは、そんな AI や機械学習、ディープラーニングの知識を問う試験です。
機械学習やディープラーニングというと、数式がいっぱい出てきて難しそうですよね。内容の難しさはもちろんですが、 G検定 は 2019 年から試験が始まった、期待の新人といえる資格試験なのです。そのため、対策方法や過去問の情報がまだ出ておらず(出題問題は非公開です)、さらに難易度を上げています。
このコースでは、そんな G検定 の試験攻略のコツやよく出題されるポイントと、そのポイントとなる AI 関連の基礎を解説いただきました。
なお、 G検定 の G は、ジェネラル( general )から来ています。ジェネラリスト向けなので、出題範囲は AI の歴史や基礎知識に最新の技術トレンド、さらには数学まで、幅広い範囲に及びます。
このコースではそれを3時間で解説するため、受験のためにどのような知識が必要になるのか、その全体像を紹介いただいています。とにかくボリュームたっぷりでした。
では、どのような内容だったのか、レポートします!
もくじ
コース情報
前提知識 |
|
---|---|
受講目標 |
|
講師紹介
このコースで登壇されたのは 植田 崇靖 さん です。以前の参加レポートでもご登壇頂いています。

それ以外にも、植田さんの開発した、何台かの台車がカルガモのように人のあとをついてくる自動追尾台車「ついてくる台車 カルガモちゃん」は、テレビでも何度か紹介されているので、ご存知の方も多いのではないでしょうか。
G検定 とは
最初に、 G検定 の特徴と攻略法が解説されました。
G検定 は、日本ディープラーニング協会による資格試験です。
- 受験方法はオンライン試験
- 自宅で受験可能
- 試験時間は 120 分
- 出題形式は 220 問程度の選択式
- 知識 + 計算問題
- 合格点は非公開
- ただ最近の傾向では、 7 割とっていれば合格かと思われる
なお、合格すると、質問やイベント情報などの Slack グループに入ることができるそうです。
出題範囲は、シラバスによると、以下のとおりです。
- 人工知能( AI )とは(人工知能の定義)
- 人工知能をめぐる動向
- 人工知能分野の問題
- 機械学習の具体的手法
- ディープラーニングの概要
- ディープラーニングの手法
- ディープラーニングの研究分野
- ディープラーニングの応用に向けて
G検定とは – 一般社団法人日本ディープラーニング協会【公式】より引用
このうち、特に前半の出題傾向にはあまり変化がありません。
その一方で、「ディープラーニングの応用に向けて」は、そのときの流行り廃りなどによって変化があり、試験対策はちょっと難しいそうです。
G検定 の特徴と対策
では、どんなことを勉強すればよいのか、試験の特徴と、その対策を紹介いただきました。
- シラバスに関連する知識
- このコースで最低限のことを学ぶ
- 昔は参考書もなかったが、最近は増えてきた
- 解答方法はラジオボタン or チェックボックスで選択
- 1 つだけとは限らない。複数の場合もある
- 計算問題も選択肢から選ぶ
- 5 割程度が基礎的な問題、 3 割程度が少し高度な問題、残り 2 割が最近の話題
- 確実に取れる問題を落とさないことが重要
- オンライン試験なので、頻出ワードなどについては Wikipedia などのサイトをブラウザのタブで個別に開いておく
- 類似した内容が別の問題で問われることもあるので、解答後でもタブは閉じないこと
- 最近の話題などは迅速に調べることができると逆に得点源になりうる
- 問題数が多い( 220 問程度)。 1 問 30 秒でも足りない
- あとで見直すチェックを入れる機能があるので活用する
- 自分のわかるところから答えて、残りで最近の話題を、とすると良さそう
- 優先順位
- AI やアルゴリズム関連は重点的に出題される傾向あり
- 計算問題もあるためペンや紙などもあらかじめ用意すること
- 筆記用具を取りに行く時間ももったいない
- 受験環境を確認しておく(必ず)
- 家の PC で受験するため事前に動作確認のためにサンプル問題を解いておくこと
- 時間配分
- 長時間の試験のため、残り問題数と残り時間の大まかなスケジュールを事前に作成しておく
- 1 つの問題にあまり時間をかけない
- トイレ、食事などは事前に済ませ、携帯などは鳴らないように設定するなど、試験に集中できる環境で試験に臨むこと
- 120 分だが、実は 5 分前からアクセスでき、実は試験時間後にも余裕がある
- 自分がスタートボタンを押してから 120 分ということ
- 参考書など
- いつでも手に取れる位置に用意する
- 電子書籍のほうが検索が楽とは言えそう
- 紙の書籍の場合は、出そうなところに付箋をつけたりするとよい
G検定 試験中のテクニック
つづいて、自宅で受験できる = 検索ができるので、試験中も対策テクニックがあります。
- 時間配分(改めて)
- 120 分で 220 問程度なので 1 問 30 秒
- 10 秒以上は考えずに調べること
- 時間がかかりそうなものにチェックしておき最後に回すことも必要
- 問題文
- 正解だけでなく不正解を選択するものもあるので注意
- 虫食い問題もあるためどこの穴埋めなのかを確認する
- 問題集の検索
- 試験中は問題集や Web から調べることが多い
- 同じ内容が別に問われることもあるため、 一度検索したあと、ほかの問題の解答にも使えることが多い
試験の出題ポイントを解説
ここからは出題範囲から、よく出題されるキーワードがあるので、それに関して出題されやすいところや用語の解説をいただきました。
また広大な範囲を扱うので、詳細まで解説していると、とても 3 時間では収まりきれないため、書籍などで補完して欲しいとのことでした。
このレポートでも箇条書きにしながら、重点ポイントを紹介したいと思います。
人工知能(AI)とは
ここから怒涛の AI の基礎知識を解説頂いたのですが、植田さんから冒頭に、
「人工知能学会のページを見ると体系的なので、あわせて読まれると良いでしょう」
とのことでした。
AIマップ – 人工知能学会 (The Japanese Society for Artificial Intelligence)
このマップをチラ見して、「カオス. . .」と思ったのは私だけでしょうか。
- 強いAI 弱いAI
- 第 1 次 AI ブーム
- 探索と推論
- 探索木
- ボードゲーム
- 探索と推論
- 第 2 次 AI ブーム
- 知識表現
- 対話システム
- ELIZA
- 対話システム
- エキスパートシステム
- 意味ネットワーク
- オントロジー研究
- IBM ワトソン
- 東ロボ
- 知識表現
- 次元の呪い
- 使うパラメータが指数関数的に増える
- 統計的自然言語処理
- ディープニューラルネットワーク( DNN )
- 出力が最大化するよう入力のパラメータを自動で調整する
- ex. 入力: 気温、天気、来店客数 など -> (中間層 [隠れ層]) -> 出力: アイスクリームの売上
- 中間層が 4 層以上になるとディープラーニングという
- ILSVRC(imageNet Large Scale Visual Recognition Challenge)
- imageSet という画像セットを使ったコンテスト
- トイプログラム
- 知識獲得のボトルネック
- フレーム問題
- シンギュラリティ
数学的基礎
ここは計算になってしまうので、ここではよく出る分野だけ紹介します。
- 行列・線形代数
- 行列
- ベクトル
- 行列
- 行列演算
- スカラー倍
- 行列の和
- 行列の積
- 行列
- 基礎解析
- 微分
- 偏微分
- 微分
この中でも、行列計算は頻度が高く 1 〜 2 問は出題され、逆に、微分は出題頻度は低い、との有益情報も紹介いただきました。
ちなみに、わたしは出来る気がしません。
機械学習の具体的手法
機械学習の具体的手法は大事な部分で、試験にもよく出題され、実際の AI でもよく使う部分です。
その手法は大きく分けて、教師あり学習と、教師なし学習、両者を組み合わせた半教師あり学習、さらに強化学習があります。
このレポートでも、ここからは解説いただいたキーワードとポイントを紹介して参ります。
- 教師あり学習
- 線形回帰
- 単回帰分析
- 重回帰分析
- ロジスティック回帰
- シグモイド関数
- ソフトマックス関数
- 尤度関数
- サポートベクターマシン( SVM )
- 分類でよく使われるが、回帰でも使われないことはない
- 決定木
- アンサンブル学習
- ランダムフォレスト
- ニューラルネットワーク
- ペイジアン学習
- 実務で理解するのはとてもむずかしい。。
- それほど多くは出題されません
- 時系列分析
- AR モデル / ARMA モデル / ARIMA モデル
- クラスタリング
- k近傍法
- 線形回帰
- 教師なし学習
- 次元圧縮
- K-Means法( k平均法 )
また、機械学習の実装の流れも出題されます。
- データの準備
- 前処理
- データ選別・データクレンジング
- 特性スケーリング
- アノテーション
- データの拡張
- モデルの学習
- ハイパーパラメータのチューニング
- ハイパーパラメータ
- 学習率
- パラメータの更新単位
- 学習
- 汎化誤差
- 誤差関数
- ハイパーパラメータのチューニング
- モデルの評価
- 評価方法
- 公差検証
- ホールド・アウト法
- k-分割公差検証
- 評価指標
- 正答率
- F値
- 過学習
- 評価方法
ディープラーニングの基礎
ディープラーニングについて学ぶにあたり、改めてニューラルネットワークについてまとめます。
- 機械学習の 1 つ
- 人間の脳神経回路を模したもの
- 多層的にすることで複雑な関数を近似できるので、データに含まれる特徴を捉えることが可能
- 特に多層化されたものをディープラーニングと呼ぶ
- 機械学習と違い、事前に特徴量を設計する必要が無く、学習によって特徴量を得ることができる
- 内部表現:観測データから本質的な情報を抽出した特徴
- エンドツーエンド学習:特徴量の設計とその後の処理を自動的に行うことができる
- 機械学習に比べ、計算量が多くなる
ここでも解説いただいたキーワードを紹介します。
- 多層パーセプトロンの詳細
- 活性化関数
- ステップ関数
- 恒等関数
- ソフトマックス関数
- 中間層の活性化関数
- シグモイド関数
- Relu関数
- 確率的最急降下法
- 勾配降下法
- バッチ学習
- 学習率
- 勾配降下法
- 活性化関数
- 過学習を防ぐテクニック
- ドロップアウト
- 正則化
- バッチ正規化
- 学習のテクニック
- データの正則化
- 学習率の決め方
- ハイパーパラメータの決め方(用語を覚えておけばいい)
- グリッドサーチ
- ベイズ最適解
- 重み付けの初期値
最後に、ニューラルネットワーク全般のキーワードをおさえておきます。
- ディープラーニングでよく使われるデータセット
- ImageNet(画像)、MNIST(手書き文字)、CIFAR-100(画像)、ILSVRC2012(画像)
- ハードウェア:GPU(行列計算に特化)
- フレームワーク(名前ぐらいおぼえておく)
- TensorFlow(Google)、PyTorch(Facebook)、Chainer(PFN :開発終了)、Caffe、CNTK(Microsoft)
ディープラーニングの手法
ディープラーニングにはさまざまな手法があります。それぞれの手法を見ていきます。
- 畳み込みネットワーク( CNN )
- 入力層 -> 畳み込み層 プーリング層 -> (中間層) -> 全結合層 -> 出力層
- 代表的なモデル(よく出る)
- LeNET( CNN の元祖)
- AlexNet
- GoogleNet
- VGG16
- ResNet
- 学習済みモデル
- 転移学習
- ファインチューニング
- 蒸留
- 転移学習
- 再帰型ニューラルネットワーク( RNN )
- (あまり深堀りした出題はないんじゃないかなぁとのコメント)
- 自己符号化器
- ファインチューニング
- 深層強化学習
- 強化学習
- Q学習
- DQN
- Deep Mind 社が開発
- 強化学習
- 深層生成モデル
- GAN(名前がよく出る)
- 訓練データを使って新しいデータを生成する
- GAN(名前がよく出る)
ディープラーニングが盛んな研究分野
ディープラーニングの活用が進むとともに、盛んに研究されている分野に強弱が出てきています。
- 画像認識
- LeNet
- AlexNet
- GoogleNet
- VGGNet
- ResNet
- MobileNets
- 物体検出
- バウンディングボックス:矩形領域で画像の中から位置とカテゴリーを特定
- R-CNN
- Faster R-CNN
- 一気通貫での学習が可能
- YOLO( You Only Look Once )
- SSD
- 自然言語処理
- 形態素解析:意味を持つ表現要素の最小単位である形態素まで分割し解析する手法
- データクレンジング
- BOW
- TF-IDF
- 構文解析:定義した文法に従って形態素間の関連付けを解析する手法
- 句構造、係り受け構造
- 意味解析:文が表す意味構造を認識
- 感情解析
- 含意関係解析:2つの文のうち、一方の文が他方の文の意味を含むかどうか
- 形態素解析:意味を持つ表現要素の最小単位である形態素まで分割し解析する手法
- 音声処理
- 音声を聞き取る音声認識
- 音声を発声する音声合成
- 音声認識
- 隠れマルコフモデル
- GMM-HMM
- DNN-HMM
- CTC
- 音声合成
- WaveNet
分野というより手法ですが、強化学習もここで紹介されました。
- 深層強化学習
- DQN
- AlphaGO
- AlphaGO Zero
- アルファスター
ディープラーニングの応用に向けて
冒頭でも語られたように、ディープラーニングの応用は変化が激しいため、試験対策はちょっと難しいそうで、キーワードが並べられました。
- 製造業
- スマート工場
- インダストリー4.0(ドイツ)
- Industrial Internet(米国)
- 中国製造2025(中国)
- Society5.0(日本)
- Connected Indestries: 2017 年経済産業省
- IoT
- エッジコンピューティング
- クラウドコンピューティング
- ロボティクス
- マルチモーダルな情報
- マルチエージェント強化学習
- アクチュエータ
- スマート工場
- 自動車産業
- 自動運転
- 完全自動運転、レベル 5
- 自動ブレーキ、レベル 1
- 2025 年までに完全自動運転
- Waymo(Google)
- 生産工程
- 製造現場のリアルタイムデータ
- 熟練技術者の匠の技をディープラーニングで継承
- 自動運転
- インフラや農業
- インフラ:ドローン(によるデータ)の活用
- 農業:スマート農業
- 医療
- 画像による診断支援
- 医薬品開発(創薬)の支援
- 防犯・防災
- 監視カメラ
- 防犯ロボット
- 教育
- EdTech
- アダプティブ・ラーニング
- AI-OCR
- 金融業
- Fintech
- 株価予測、不正取引検知
- チャットボット
- RPA
- 物流
- EC
- 流通
- Amazon Go
- データマイニング
その他 AI白書を見ると、ディープラーニングの適用がどこまで進んでいるのか、わかるようになるとのことでした。
まとめ
いかがでしたでしょうか。用語やポイントがたくさん出てきてボリュームたっぷりでした。みなさんもご覧になりながら、無限スクロールするのかと思われたかと思います。。
これら全部解説された植田さんもコース終了ごろには、どっとお疲れの様子でした。怒涛の解説、ありがとうございました!
とはいえ、今回はさわりだけで、すべてカバーできているわけではありません。たとえば、数学などは分野名が挙げられただけでしたね。植田さんが繰り返しお話されていたように、今回のポイントを押さえた上で、自分で深堀りが必要です。
G検定はまだ新しく、また過去問も公開されておらず、どの分野やどのポイントを勉強していけばいいか、なかなかわかりません。
そうした中で、どのように対策が必要で、出題ポイントをザッと見るだけでも AI がどんな体系になっているのか、わかる内容でした!(理解したとは言ってない)

SEプラスにしかないコンテンツや、研修サービスの運営情報を発信しています。