雲端運算是基於網際網路的運算方式,它通過網際網路為個人使用者或企業使用者提供按需即取的服務。隨著電腦技術的發展,資料的存儲量成倍的增長,Data Mining 技術在“資料海洋、知識荒漠”的背景下應運而生的,並且一經出現就得到各個領域的重視。隨著Data Mining 的逐漸成熟,以Data Mining 為核心的Business Intelligence(BI)已經成為了IT 和其他行業中的必爭之地同時伴隨著Big Data 的熱潮使得海量資料分析變成月來越重要的一個研究方向。雲端運算可以實現使用端通過線上上傳資料或購買資料,通過雲資料倉庫服務,進行資料倉庫建模和資料抽取,線上支付使用Data Mining 工具和Business Intelligence 相關分析處理軟體。Data Mining 和Business Intelligence 的原理相似,均由資料提供資訊、產生知識,再由知識累積智慧。而雲端運算可以使這個過程在網際網路上得以實現。也就是說雲端運算可以提供基於SaaS 的知識與智慧分析的服務(Information &Intelligence as a Service),簡稱IIaaS,它是SaaS 的延伸。
基於此利基MS Office Excel 變成為數據分析最方便有用及功能強大的軟體(全世界約有10 億人口會使用EXCEL) MS Office Excel 2013 結合SQL Server 2012 -2014支援解決大數據(BIG DATA)資料工作表(Work Sheet),並可以同時存儲大量變數的資料。為能有效提升Excel 2013 使用者資料處理和分析的能力,微軟公司提供了一個免費的資料採礦模組。通過調用該模組,Excel 2013 使用者可以方便快速的完成以往只有使用專業資料採礦軟體才能完成的任務。同時亦提供可視化的模組及動態分析模組(Power BI)使得海量數據的分析變得輕鬆又有趣。
本書的第一部分詳細敘述資料採礦的一般概念、通行規範、方法技術、以及軟體應用等。使讀者獲得一個較為清晰和正確的資料採礦觀念。本書的第二部分圍繞Excel 2013 的資料採礦模組,通過大量操作示範,詳細講述了Excel 2013 資料採礦模組的九大模型的使用。這些模型包括決策樹、貝氏機率分類、關聯規則、群集分析、時序群集、線性回歸、Logistic 回歸、類神經網路和時間序列分析。基本含蓋了主要的資料採礦方法。第三部分介紹了Excel 2013 的表格工具。結合第二部分所介紹的資料採礦方法,使用改進過的Excel 表格工具,可以很方便的進行圖形化的分析。這些分析方法在第三部分都有詳細的介紹。第四部分是資料採礦的實例。包含了銀行業、電信業、行銷企業及臺灣創新產業。通過詳細的操作講解和結果解釋,讀者可以獲得實際的資料採礦經驗,並能迅速在自己所處的領域中加以應用。這是一本實用的書,邁向 BIG DATA 領域的開門書,才疏學淺書中錯誤及不周之處請大家海涵並不吝指正。
Part I Data Mining演算法介紹
第0章 前言
第1章 資料採礦簡介
第2章 資料採礦運用理論及技術
第3章 資料採礦與其他相關領域的關係
第4章 資料採礦商業軟體產品及其應用現狀
Part II Excel 2013資料採礦模組介紹
第5章 安裝與設定資料採礦增益集
第6章 Excel 2013資料採礦入門
第7章 決策樹
第8章 貝氏機率分類
第9章 關聯規則
第10章 群集分析
第11章 時序集群
第12章 線性迴歸
第13章 羅吉斯迴歸
第14章 類神經網路
第15章 時間序列
第16章 DMX(Data Mining Extension)介紹
Part III Excel 2013表格工具介紹
第17章 其他分析方法
第18章 Excel 2013 Power BI
Part IV 資料採礦範例
第19章 應用CRISP-DM在各產業建立資料採礦模型
謝邦昌 教授
學歷:國立台灣大學生物統計學博士
現任:台北醫學大學管理學院院長、大數據研究中心主任、中華資料採礦協會榮譽理事長
主要經歷:
經歷:
鄭宇庭
學歷:美國明尼蘇達大學 統計學 博士
現職:國立政治大學統計學系 副教授
主要經歷: