App下載

Python簡單分析高考數(shù)據(jù)

猿友 2018-08-13 16:19:09 瀏覽數(shù) (5754)
反饋

本文轉(zhuǎn)載至知乎ID:Charles(白露未晞)知乎個(gè)人專欄

下載W3Cschool手機(jī)App,0基礎(chǔ)隨時(shí)隨地學(xué)編程>>戳此了解

導(dǎo)語

不像考卷,現(xiàn)實(shí)生活中,有些事永遠(yuǎn)沒有答案。

導(dǎo)語

2018年的高考已經(jīng)過去了一周,熱點(diǎn)也逐漸從高考轉(zhuǎn)向了世界杯,不樂意當(dāng)偽球迷的我還是選擇簡單且隨意地分析一下高考的一些數(shù)據(jù)~~~

讓我們愉快地開始吧~~~

相關(guān)文件


相關(guān)文件

網(wǎng)盤下載鏈接: https://pan.baidu.com/s/1zvVTTxfjmrTxjjX_M_DoEA

密碼: 9jyd

相關(guān)文件中包含本文所涉及到的所有源代碼和數(shù)據(jù)。

數(shù)據(jù)源于網(wǎng)絡(luò),不保證其完全可靠。

開發(fā)工具


開發(fā)工具

Python版本:3.6.4

相關(guān)模塊:

pyecharts模塊;

以及一些Python自帶的模塊。

環(huán)境搭建


環(huán)境搭建

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

pyecharts模塊的安裝可參考:

安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。

額外說明:

pyecharts模塊安裝時(shí)請依次執(zhí)行以下命令:

pip install echarts-countries-pypkg

pip install echarts-china-provinces-pypkg

pip install echarts-china-cities-pypkg

pip install pyecharts

若安裝過程中出現(xiàn):

'utf-8' codec can't decode byte 0xb6

或者類似的編碼錯(cuò)誤提示。

可嘗試修改Python安裝文件夾下如下圖所示路徑下的__init__.py文件的第75行代碼:

修改為下圖所示內(nèi)容:

“一本正經(jīng)的分析”


開始分析

首先讓我們來看看從恢復(fù)高考(1977年)開始高考報(bào)名、最終錄取的總?cè)藬?shù)走勢吧:

T_T看來學(xué)生黨確實(shí)是越來越多了。

不過這樣似乎并不能很直觀地看出每年的錄取比例?Ok,讓我們直觀地看看吧:

看來上大學(xué)越來越“容易”之說不是空穴來風(fēng)的,總錄取比例高的可怕~~~

那么各省的情況呢?

由于各省高考最終錄取人數(shù)的統(tǒng)計(jì)標(biāo)準(zhǔn)不一樣,有些是只統(tǒng)計(jì)本科,有些是都統(tǒng)計(jì)的,為了避免統(tǒng)計(jì)標(biāo)準(zhǔn)不一而帶來的不公平對比,我們只分析各省的高考報(bào)考人數(shù)。

從2010年開始到今年(2018年)各省份高考考生數(shù)量的分布圖如下:

T_T河南的高考考生人數(shù)真是一枝獨(dú)秀。

那么各省的大學(xué)數(shù)量又是如何分布的呢?以公辦本科大學(xué)數(shù)量作為統(tǒng)計(jì)標(biāo)準(zhǔn),其分布圖大概是這樣的:

Emmm。北京和江蘇分別位居第一和第二名。想想也是必然T_T

那么985&211高校的分布又如何呢?

“那就這樣吧,再愛都曲終人散了?!笨吹竭@個(gè)默默不說話了。

以省份為x軸,年份為y軸,該年該省報(bào)考的考生人數(shù)為z軸來更直觀地看看各省每年的高考考生數(shù)量變化情況吧:

上圖中省份的順序是這樣的:

北京、四川、陜西、江西、吉林、寧夏、廣西、內(nèi)蒙古、甘肅、西藏、福建、上海、廣東、山東、浙江、河南、安徽、江蘇、河北、黑龍江、湖南、湖北、山西、云南、貴州、海南、遼寧、重慶、天津、青海、新疆,臺(tái)灣因?yàn)闆]有數(shù)據(jù),所以沒有加入。

T_T河南的高考考生數(shù)量真的恐怖。

Emmm,因?yàn)榭捎玫臄?shù)據(jù)不多,再分析下去大概就是花式的做圖游戲了,想想還是算了吧。至于個(gè)人觀點(diǎn),還是不發(fā)表為好。畢竟,大家的“哈姆雷特”都不一樣。

更多


更多

相關(guān)文件中包含了本文所涉及到的所有源代碼、數(shù)據(jù)和結(jié)果,其中,數(shù)據(jù)來源網(wǎng)絡(luò),本人不保證其可靠性。

運(yùn)行源代碼前需將對應(yīng)的注釋去除。


0 人點(diǎn)贊