データ分析実務スキル検定【プロジェクトマネージャー級】 シラバスと問題数
分析プロジェクトの立上げ
1.業務目的に応じて適切なKPIツリーを作成することができる 出題率:5%(本試験問題数:3)
- KPIツリーの作成
- 変数のコントローラビリティ
2.データの取扱いに関する利用規約、法令やガイドラインを理解している 出題率:3% (本試験問題数:2)
- 個人情報の適切な扱い
- データ利用規約に応じたデータの適切な扱い
- 情報漏洩のリスクとデータ保管場所の選定
データ準備
1.データ分析に必要な前処理を理解している 出題率:3%(本試験問題数:2)
- データの基本的な前処理
ーデータ型の確認と変更
ー欠損処理
ー再カテゴリ化
ー標準化
ー対数変換
ー外れ値・異常値の処理
ーOne-Hot Encoding(ダミー変数)
2.SQLの基礎的なスキルを習得している 出題率:8%(本試験問題数:5)
- SQLの基本操作(標準SQL)
ーユニークな値の抽出ができる
ー列の値ごとの集計ができる
ー複数のデータベースを特定の列をキーとして結合できる - 対象句:
ーSELECT, FROM, WHERE, GROUP BY, DISTINCT
ーORDER BY, COUNT
ーINNER JOIN, L/R OUTER JOIN
3.基本的なデータ可視化手法を理解している 出題率:8%(本試験問題数:5)
- グラフの解釈と選択
ー基礎グラフ(円グラフ, 棒グラフ, 折れ線グラフ)
ー統計グラフ(ヒストグラム, 累積ヒストグラム, 箱ひげ図, 散布図)グラフ作成における基本的な注意点
(例:バイアスをかけないグラフ作り)
4.基礎集計を通じて、データの全体像や質を確認することができる 出題率:13%(本試験問題数:8)
- 基礎集計の読み取り
集計値(最大値 , 最小値 , 合計値)
要約統計量(代表値 , 散布度)
- 代表値(平均値 , 中央値 , 最頻値)
- 散布度(分散 , 標準偏差) - 分布の型(右/左に裾の長い分布 , 単峰性の分布 , 二峰性の分布)
- クロス表の作成と解釈
- Excelの基礎関数(FREQUENCY , IF , SUM , AVERAGEなど)
- ピボットテーブル
課題特定〜施策提案〜施策評価
業務目的に応じて適切なコーディング(R/Python)ができているかをおおよそ確認できる 出題率:22%(本試験問題数:13)
- 短いコードの読み取りができる
- データの読み込みからモデリングまでのコーディング
- データの読み込み
- データ構造とデータ型の確認
- データの要約統計量や概観の確認
- 前処理
- モデリング・可視化
- プログラミングの基礎知識
- 制御構文の基礎(For文とIF~elif~else文)
- 関数定義(def ) - 対象例
Python:
range, print, append, remove, describe, dtype, pandas(module), scikit-learn(module)など
read.csv, head, str, summary, mean, sd, plot など
基本的な統計手法を理解している 出題率:7%(本試験問題数:4)
- クロス表解析(リフト値 , 期待度数表)
- 2変数解析(相関係数)
- 確率分布の利用(正規分布 , 二項分布 , ポアソン分布)
- 仮説検定の構造(帰無仮説 , 対立仮説 , 有意水準 , P値)
- 回帰分析(回帰係数 , 決定係数 , 自由度調整済決定係数 , 標準誤差 , 回帰係数の検定 , 多重共線性 , VIF , ダミー変数)
- ロジスティック回帰(オッズ , オッズ比)
主要な機械学習の概要と使い分けを理解している 出題率:17%(本試験問題数:10)
教師あり学習
– 予測モデルと分類モデル
– モデルの概要と使い分け(ロジスティック回帰、決定木、アンサンブルモデル、ニューラル
ネットワーク、深層学習 など)
– ビジネスシーンでよく使われるモデルのアウトプット解釈(ロジスティック回帰、決定木、アン
サンブルモデル)
教師なし学習
– 次元圧縮(主成分分析)の概要と使い方・アウトプット解釈
– クラスタリング( kmeans )の概要と使い方・アウトプット解釈
予測モデルの評価観点とモデル改善のための対応手法を理解している 出題率:7%(本試験問題数:4)
予測モデルの基本的な作成手順
予測モデルの性質
- 学習データとテストデータ
- 汎化性能とオーバーフィッティング
様々な精度指標の概要と用途
- MSE,RMSE,MAE,決定係数
- 混合行列(正解率, 偽/真陽性率, 偽/真陰性率)
- ROC曲線とAUC
施策の評価と効果検証ができる 出題率:7%(本試験問題数:4)
仮説検定
- 仮説検定の構造(帰無仮説 , 対立仮説 , 有意水準 , P値)
- 基本的な仮説検定(t検定 , カイ二乗検定)
- 中心極限定理の概念
ABテストの設計
- 適切なテスト指標の選択
- サンプルサイズの見積(有意水準 , 検出力 , 効果量)
モデル運用
- モデル展開の計画と実施
- モデル保守の計画(モデル利用中止・改善の判断)
※データ分析実務スキル検定 公式HP抜粋