- 大數(shù)據(jù)分析實(shí)訓(xùn)心得體會(huì) 推薦度:
- 相關(guān)推薦
數(shù)據(jù)分析心得體會(huì)
在平日里,心中難免會(huì)有一些新的想法,寫心得體會(huì)是一個(gè)不錯(cuò)的選擇,這樣能夠讓人頭腦更加清醒,目標(biāo)更加明確。那么要如何寫呢?下面是小編收集整理的數(shù)據(jù)分析心得體會(huì),歡迎閱讀與收藏。
在數(shù)據(jù)分析這門課程當(dāng)中主要學(xué)習(xí)了numpy和pandas和數(shù)據(jù)挖掘的知識(shí),學(xué)習(xí)過程很充實(shí),也不是很難。
首先學(xué)習(xí)了Numpy, NumPy(Numerical Python)是Python語言的一個(gè)擴(kuò)展程序庫,主要學(xué)習(xí)了
1、矩陣生成,
2、矩陣切片,
3、軸對(duì)換、相乘,
4、條件填入(where),
5、數(shù)據(jù)處理。NumPy是一個(gè)運(yùn)行速度非?斓臄(shù)學(xué)庫,主要用于數(shù)組計(jì)算。
在pandas中有兩類非常重要的數(shù)據(jù)結(jié)構(gòu),即序列Series和數(shù)據(jù)DataFrame。Series類似于numpy中的一維數(shù)組,除了通吃一維數(shù)組可用的函數(shù)或方法,而且其可通過索引標(biāo)簽的方式獲取數(shù)據(jù),還具有索引的自動(dòng)對(duì)齊功能;DataFrame類似于numpy中的二維數(shù)組,同樣可以通用numpy數(shù)組的函數(shù)和方法,而且還具有其他靈活應(yīng)用。之后學(xué)習(xí)了數(shù)據(jù)索引index,包括了通過索引值或索引標(biāo)簽獲取數(shù)據(jù)以及自動(dòng)化對(duì)齊;此外,pandas模塊為我們提供了非常多的描述性統(tǒng)計(jì)分析的指標(biāo)函數(shù),如總和、均值、最小值、最大值等,我們來具體看看這些函數(shù);在SQL中常見的操作主要是增、刪、改、查幾個(gè)動(dòng)作,那么pandas能否實(shí)現(xiàn)對(duì)數(shù)據(jù)的這幾項(xiàng)操作呢?答案是Of Course!我們發(fā)現(xiàn),不論是刪除行還是刪除列,都可以通過drop方法實(shí)現(xiàn),只需要設(shè)定好刪除的軸即可,即調(diào)整drop方法中的
axis參數(shù)。默認(rèn)該參數(shù)為0,表示刪除行觀測(cè),如果需要?jiǎng)h除列變量,則需設(shè)置為1。在Excel中有一個(gè)非常強(qiáng)大
的功能就是數(shù)據(jù)透視表,通過托拉拽的方式可以迅速的查看數(shù)據(jù)的聚合情況,這里的聚合可以是計(jì)數(shù)、求和、均值、標(biāo)準(zhǔn)差等。pandas為我們提供了非常強(qiáng)大的函數(shù)
pivot_table(),該函數(shù)就是實(shí)現(xiàn)數(shù)據(jù)透視表功能的。
數(shù)據(jù)挖掘的技術(shù)與方法相關(guān)知識(shí)包括:數(shù)據(jù)挖掘的方法分為描述性與預(yù)測(cè)性兩種。其中描述性數(shù)據(jù)挖掘指的是分析具有多個(gè)屬性的數(shù)據(jù)集,找出潛在的模式和規(guī)律,沒有因變量。要采用的算法:聚類、關(guān)聯(lián)分析、因子分析、主成分分析等。預(yù)測(cè)性數(shù)據(jù)挖掘指的是用一個(gè)或多個(gè)自變量預(yù)測(cè)因變量的值。主要算法:決策樹、線性回歸Logistic回歸、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、判別分析。
通過這幾天的學(xué)習(xí)我了解到數(shù)據(jù)分析的復(fù)雜性和難度,想要學(xué)好的它,還需要我花費(fèi)很長(zhǎng)時(shí)間。
【數(shù)據(jù)分析心得體會(huì)】相關(guān)文章:
數(shù)據(jù)分析說課稿11-20
數(shù)據(jù)分析總結(jié)09-30
數(shù)據(jù)分析報(bào)告07-28
數(shù)據(jù)分析報(bào)告09-23
數(shù)據(jù)分析報(bào)告02-02