クラウドスペースで機械学習ができるAzure Machine Learning(2)モジュールについて

クラウドスペースで機械学習ができるAzure Machine Learning(2)モジュールについて

<<前の記事に戻る

 

本シリーズは、Azure MLについて複数回にわけご紹介しています。
今回は、モジュールの概要についてです。

機械学習に用いる主要なモジュールカテゴリは、大きく10種類あり、これらを組み合わせることで、様々な分析ニーズを満たすことができます。

①Data Format conversions(データの形式の変換)

2
このカテゴリに含まれるモジュールは、データを他の機械学習ツールのデータ形式に変換する場合に使用します。
例えば、WekaのARFFや、CSVなどのファイル形式をAzure MLでで使用できるように変更できます。

 

②Data Input and Output(データの入力と出力)

3
Hadoop クラスター、Azure テーブル ストレージでは、Web Url などのデータ ソースをクラウドからデータを読み取るには、これらのモジュールを使用します。
サーバー経由でデータをやり取りする際などに使います。

 

③Data Transformation(データ変換)

4
このカテゴリに含まれるモジュールは、分析用データを作成する場合に使用します。 データ型の変更、列へのフラグ設定 (特徴かラベルか)、特徴の生成、データの拡張または正規化など、さまざまなモジュールが用意されています。
合成変数の生成など、モデルに投入するためのデータ加工ができます。
また、学習用と評価用のデータ分割の際に、サクッと出来て便利です。

 

④Feature Selection(特徴選択)

5
このカテゴリに含まれるモジュールは、広範に研究されている統計的手法でデータの最も優れた特徴を識別する場合に使用します。
線形判別分析や、各指標のフィルターに基づく特徴の選択ができます。

 

⑤Machine Learning(機械学習)

6
このグループには、機械学習 Azure マシンを学ぶことでサポートされているアルゴリズムのほとんどが含まれています。
また、モジュールのモデルのトレーニング、スコアを生成して、モデルのパフォーマンスを評価して、アルゴリズムをサポートするためのものも含まれています。
決定木・回帰分析やクラスタリングなどの代表的な手法だけでなく、交差検証などのモデル評価も手軽に行えます。

 

⑥OpenCV Library Modules(OpenCV ライブラリ モジュール)

7
このカテゴリに含まれるモジュールを使用すると、一般的なオープン ソース ライブラリに簡単にアクセスしてイメージの処理や分類を行うことができます。
例えば、OpenCVライブラリで、事前トレーニング済みの、正面の顔のイメージ分類モデルを作成することができます。

 

⑦RLanguage Modules(R 言語モジュール)

9
このカテゴリに含まれるモジュールは、カスタムの R コードを実験に追加したり、R パッケージに基づいて機械学習モデルを実装する場合に使用します。

 

⑧Python Language Modules(Python 言語モジュール)

8
このカテゴリに含まれるモジュールは、カスタムの Python コードを実験に追加する場合に使用します。

 

⑨Statistical Functions(統計関数)

10
このカテゴリに含まれるモジュールは、確率分布の計算、カスタムの計算タスクの作成など、数値変数に関連するさまざまなタスクを実行する場合に使用します。

 

⑩Text Analytics(テキスト分析)

11
残念ながら、本稿作成時点では日本語未対応です。

上記のモジュールを使い分析をすることができます。
次回は、機械学習系のモジュールをご紹介します。

 

続きを読む>>