本次課程(上)(下)屬連貫課程,適合第一次接觸Hadoop的夥伴,(上)(下)。

一、主辦單位:成大統計系、計算機與網路中心
二、授課者:炬識科技專業講師
三、對象:成大教職員生
四、上課地點:成功校區計網中心(資訊大樓)75309電腦教室
五、報名網址:https://activity.ncku.edu.tw/index.php?c=apply&no=2679
六、課程內容:
成大統計系於課後會發給上課同學修課證書 和 提供餐盒。

【Hadoop初學者入門(上)】
1.時間:106年10月19日(四)15:00~18:00(3小時)
2.課程大綱:
過去資料儲存與取用在大型企業裡常見的服務組合是用「關聯式資料庫」支援即時資料交易,「資料倉儲」提供非即時的資料分析。隨著企業累積的
資料越來越龐大,並且開始著手應用非結構化的資料,開源的「分散式儲存與平行運算系統」從10年前問世後,逐漸成為大數據時代的要角,它就是
著名的黃色小象Hadoop。這個可以處理PB規模資料的系統,實際上是由各種元件組成,包含資料導入工具、資料儲存層、資料處理層與資料取用層。
第一堂課將介紹Hadoop的發展與應用,並且帶領大家用最簡單的方法,學習如何架設Hadoop環境。

15:00~16:00 Hadoop的發展與應用
16:00~18:00 Hadoop平台建置實作

【Hadoop初學者入門(下)】
1.時間:106年10月20日(五)15:00~18:00(3小時)
2.課程大綱:
前一次課程我們已經架設了Hadoop環境,這一節的課程就是要學習如何使用它。我們將在這一節課中示範如何從關聯式資料庫,利用Hadoop生態系的
元件,將資料導入Hadoop的資料儲存層當中。接著我們將繼續練習如何在Hadoop環境中,安裝R語言的相關服務,以及用RStudio存取Hadoop資料的方
法。

15:00~16:00 檔案格式與資料表格式資料導入
16:00~18:00 在Hadoop環境裏運行R服務