色狠狠色狠狠综合一区_久久青草国产免费观看_日本xxxx19视频_女人与男人做爰视频

當前位置: 首頁 > 內訓課程 > 課程內容
廣告1
相關熱門公開課程更多 》
相關熱門內訓課程更多 》
相關最新下載資料

使用python做數據分析

課程編號:29156

課程價格:¥23000/天

課程時長:5 天

課程人氣:430

行業類別:行業通用     

專業類別:大數據 

授課講師:孫增輝

  • 課程說明
  • 講師介紹
  • 選擇同類課
【培訓對象】
有數據庫基礎知識 有編程基礎知識 有統計學基本知識 有數據分析、數據挖掘、統計分析的基本概念 對數據分析感興趣

【培訓收益】


第1天
主題 Python的優點和不足
大綱 優點
1、python語言更接近自然語言
2、python是開放源碼的自由軟件
3、python可移植在各種平臺上
4、python支持面向過程的函數編程,也支持面向對象的抽象編程
5、可擴展和可嵌入
6、各種功能豐富的庫
7、編碼規范。各種強制縮進方式提供了可讀性。
不足
8、運行速度可能不理想。
9、python是開源軟件,通過封裝加密進行商業化,就是一個問題。
10,、繁多的標準庫和第三方庫
主題 重要的python庫
大綱 1、NumPy (numerical python)
2、Pandas 處理結構化數據的大量數據結構和函數
3、Matplotlib 繪制數據圖表
4、IPython 交互式窗口,科學計算工具集的一部分
5、SciPy 專門解決科學計算中,標準問題域的包的集合。
6、Scikit-learn 機器學習庫
主題 Python的安裝和配置
大綱 1、anaconda
2、Windows系統下的安裝
3、Linux系統下的安裝
主題 Ipython基礎
大綱 1、IPython交互式計算和開發環境
2、Ipython啟動、簡單命令
3、內省
4、使用歷史命令
5、與操作系統交互
6、軟件開發工具
7、ipython html notebook
8、用ipython提高代碼開發效率
9、ipython高級功能
主題 Ipython編碼效率與高級功能
大綱 1、利用python提高代碼效率的幾點提示
2、高級Ipython功能
第2天
主題 numpy數組和矢量計算
大綱 1、NumPy的ndarray:多維數組
2、通用函數 數組函數
3、利用數組進行數據處理
4、用于數組文件的輸入輸出
5、線性代數
6、隨機數生產
7、隨機漫步
主題 pandas 數據處理分析工具
大綱 1、pandas的數據結構介紹
2、基本功能
3、匯總和計算描述統計
4、處理缺失數據
5、層次化索引
6、其他有關pandas的話題
主題 數據加載 轉儲
大綱 1、讀寫文本格式的數據
2、二進制數據格式
3、使用HTML和Web API
4、使用數據庫
5、使用excel文件
6、使用hadoop大數據
主題 簡單數據清洗
大綱 1、合并數據集
2、重塑和軸向旋轉
3、數據轉換
4、字符串操作
主題 python的繪圖和可視化
大綱 1、python的圖形化工具生態系統
2、matplotlib API入門
3、pandas中的繪圖函數
4、繪制地圖
第3天
主題 數據的分組計算--分層樣本
大綱 1、GroupBy技術
2、數據聚合
3、分組運算和轉換
4、透視表和交叉表
主題 時間序列
大綱 1、日期和時間數據類型及工具
2、時間序列基礎
3、日期的范圍、頻率以及移動
4、時區處理
5、時期及其算數運算
6、重采樣及頻率轉換
7、時間序列繪圖
8、移動窗口函數
9、性能和內存使用方面的注意事項
主題 numpy高級應用
大綱 1、ndarray對象的內部機制
2、高級數組操作
3、廣播
4、ufunc高級應用
5、結構化和記錄式數組
6、關于排序
7、numpy的matrix類
8、高級數組輸入輸出
9、性能建議
主題 蒙特卡洛模擬
大綱 1、純python
2、用numpy向量化
3、用對數歐拉方法實現全向量化
4、圖形化分析
5、技術分析
主題 統計學 正態檢驗
大綱 1、正態性檢驗
2、基準案例
3、現實世界的數據
第4天
主題 金融應用 投資優化組合
大綱 1、基本理論
2、數據
3、投資組合優化
4、有效邊界
5、資本市場線
主題 k 近鄰算法
大綱 1、k近鄰算法概述
2、準備數據:從文本文件中解析數據
3、分析數據:使用matplotlib創建散點圖
4、準備數據:歸一化數值
5、測試算法:作為完整程序驗證分類器
6、使用算法:構建完整可用的系統
主題 決策樹
大綱 1、決策樹的構造
信息增益
劃分數據集
遞歸構建決策樹
2、使用matplotlib注解繪制樹形圖
matplotlib注解
構造注解樹
3、測試和存儲分類器
測試算法:使用決策樹執行分類
使用算法:決策樹的存儲
主題 概率論 樸素貝葉斯
大綱 1、基于貝葉斯決策理論的分類方法
2、條件概率
3、使用條件概率來分類
4、使用樸素貝葉斯進行文檔分類
5、使用python進行文本分類
主題 Logistic 回歸分析
大綱 1、基于Logistic回歸和sigmoid函數的分類
2、基于最優化方法的 最佳回歸系數確定
梯度上升法
訓練算法:使用梯度上升找到最佳參數
分析數據:畫出決策邊界
訓練算法:隨機梯度上升
第5天
主題 支持向量機
大綱 1、SVM應用的一般框架
2、基于最大間隔分隔數據
3、尋找最大間隔
4、SMO高效優化算法
5、利用完整plattSMO算法加速優化
6、在復雜數據上應用核函數
主題 回歸 ----- 預測數值型數據
大綱 1、用線性回歸找到最佳擬合直線
2、局部加權線性回歸
3、縮減系數來“理解”數據
嶺回歸
lasso
向前逐步回歸
4、權衡偏差與方差
主題 樹回歸
大綱 1、復雜數據的局部性建模
2、連續和離散型特征的樹的構建
3、將CART算法用于回歸
構建樹 運行代碼
4、樹剪枝
預剪枝 后剪枝
5、模型樹
6、樹回歸與標準回歸的比較
主題 大數據與mapreduce
大綱 1、mapreduce:分布式計算框架
2、hadoop流
3、mapreduce上的機器學習
4、在python中使用mrjob來自動化MapReduce
5、真的需要MapReduce嗎?

 

咨詢電話:
0571-86155444
咨詢熱線:
  • 微信:13857108608
聯系我們