データ分析ツールPADOCの発表

間違って2018/07/29日の記事を削除してしまったので再掲です。

データ前処理研究会でデータ分析ツールPADOCを発表してきました。

データ分析での前処理の議論が殆どないので、業務分析を兼ねたデータ前処理が全工程の7割を占めることが認識されていない様だ。このことはデータ取得が簡単な自然言語や画像処理以外ではデータ分析を行っている人は本当は少ないのではないかと思われる。実務で相談受ける場合は、問題を分析できるデータの所在やその量や精度の検討が最も大事である。逆説的に言うと添付資料に示す様に機械学習やその分析ツールの選択肢は限られており、この狭い選択肢に合う様に限られたデータを編集し分析ツールで如何に最大の性能を引き出すかがデータ分析の醍醐味である。

次の資料は実務に適用できる様に試作したデータ編集と分析モデルを統合的に提供する分析ツールPADOCの説明である。

www.slideshare.net