前処理大全[データ分析のためのSQL/R/Python実践テクニック]

前処理大全[データ分析のためのSQL/R/Python実践テクニック]

著者: 本橋 智光
大型本: 336ページ
出版社: 技術評論社 (2018/4/13)
言語: 日本語
ISBN-10: 4774196479
ISBN-13: 978-4774196473
発売日: 2018/4/13

書籍内容

Law of Awesome Data Scientist

データサイエンスの現場において、その業務は「前処理」と呼ばれるデータの整形に
90%以上の時間を費やすと言われています。
「前処理」を効率よくこなすことで、予測モデルの構築やデータモデリングといった
本来のデータサイエンス業務に時間を割くことができるわけです。

本書はデータサイエンスに取り組む上で欠かせない
「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。
ほとんどの問題についてR、Python、SQLを用いた実装方法を紹介しますので、
複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。

目次

Part1 入門前処理
第1章 前処理とは

Part2 データ構造を対象とした前処理
第2章 抽出
第3章 集約
第4章 結合
第5章 分割
第6章 生成
第7章 展開

Part3 データ内容を対象とした前処理
第8章 数値型
第9章 カテゴリ型
第10章 日時型
第11章 文字型
第12章 位置情報型

Part4 実践前処理
第13章 演習問題