剛開始學習數據分析的小伙伴,都會在數據分析環(huán)境上陷入抉擇,是使用python還是matlab?是使用pycharm還是VSCode亦或者是anaconda?今天小編就來告訴你,數據挖掘最好的選擇還是anaconda。那么怎么搭建數據分析環(huán)境(anaconda)呢?接下來的這篇文章告訴你。
一、Anaconda
Anaconda(水蚺)是一個捆綁了Python、conda、其他相關依賴包的一個軟件。包含了180多個可學計算包及其依賴。Anaconda3是集成了Python3的環(huán)境,Anaconda2是集成了Python2的環(huán)境。Anaconda默認集成的包,是屬于內置的Python的包。并且支持絕大部分操作系統(比如:Windows、Mac、Linux等)。下載地址如下:https://www.anaconda.com/distribution/(如果官網下載太慢,可以在清華大學開源軟件站中下載:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/)。根據自己的操作系統,下載相應的版本,因為Anaconda內置了許多的包,所以安裝過程需要耗費相當長的時間,大家在安裝的時候需要耐心等待。在安裝完成后,會有以下幾個模塊:Anaconda prompt、Anaconda Navigator、Spyder、jupyter notebook,以下分別做一些介紹。
二、naconda prompt
Anaconda prompt是專門用來操作anaconda的終端。如果你安裝完Anaconda后沒有在環(huán)境變量的PATH中添加相關的環(huán)境變量,那么以后你想在終端使用anaconda相關的命令,則必須要在Anaconda prompt中完成。
三、Anaconda Navigator
這個相當于是一個導航面板,上面組織了Anaconda相關的軟件。
四、Spyder
一個專門開發(fā)Python的軟件,熟悉MATLAB的同學會比較有親切感,但在后期的學習過程中,我們將不會使用這個工具寫代碼,因為還有更好的可替代的工具。
五、jupyter notebook
一個Python編輯環(huán)境,可以實時的查看代碼的運行效果。
使用jupyter notebook的姿勢:
1. 先打開Anaconda Prompt,然后進入到項目所在的目錄。
2.輸入命令jupyter notebook打開jupyter notebook瀏覽器。
六、conda基本使用
conda伴隨著Anaconda安裝而自動安裝的。conda可以跟virtualenv一樣管理不同的環(huán)境,也可以跟pip一樣管理某個環(huán)境下的包。以下來看看兩個功能的用法。
環(huán)境管理:
conda能跟virtualenv一樣管理不同的Python環(huán)境,不同的環(huán)境之間是互相隔離,互不影響的。為什么需要創(chuàng)建不同的環(huán)境呢?原因是有時候項目比較多,但是項目依賴的包不一樣,比如A項目用的是Python2開發(fā)的,而B項目用的是Python3開發(fā)的,那么我們在同一臺電腦上就需要兩套不同的環(huán)境來支撐他們運行了。創(chuàng)建環(huán)境的基本命令如下:
shell # conda create --name [環(huán)境名稱] 比如以下: conda create --name da-env
這樣將創(chuàng)建一個叫做da-env的環(huán)境,這個環(huán)境的python解釋器根據anaconda來,如果anaconda為3.7,那么將默認使用3.7的環(huán)境,如果anaconda內置的是2.7,那么將默認使用2.7的環(huán)境。然后你就可以使用conda install numpy的方式來安裝包了,并且這樣安裝進來的包,只會安裝在當前環(huán)境中。有的同學可能有想問,如果想要裝一個Python2.7的環(huán)境,anaconda中沒有內置Python2.7,那么該怎么實現呢?。實際上,我們只需要在安裝的時候指定python的版本,如果這個版本現在不存在,那么anaconda會自動的給我們下載。所以安裝Python2.7的環(huán)境,使用以下代碼即可實現:
conda create --name xxx python=2.7
以下再列出conda管理環(huán)境的其他命令:
創(chuàng)建的時候指定需要安裝的包:
conda create --name xxx numpy pandas
創(chuàng)建的時候既需要指定包,也需要指定python環(huán)境:
conda create --name xxx python=3.6 numpy pandas
進入到某個環(huán)境
windows: activate xxx mac/linux: source activate xxx
退出環(huán)境:
deactivate
列出當前所有的環(huán)境:
conda env list
移除某個環(huán)境:
conda remove --name xxx --all
環(huán)境下的包導出和導入:
導出:conda env export > environment.yml。
導入:conda env create --name xxx -f environment.yml。
包管理:
conda也可以用來管理包。比如我們創(chuàng)建完一個新的環(huán)境后,想要在這個環(huán)境中安裝包(比如numpy),那么可以通過以下代碼來實現:
conda remove --name xxx --all
以下再介紹一些包管理常用的命令:
在不進入某個環(huán)境下直接給這個環(huán)境安裝包:
conda remove --name xxx --all
列出該環(huán)境下所有的包:
conda list
卸載某個包:
conda remove [包名]
設置安裝包的源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes
到此這篇怎么搭建數據分析環(huán)境的文章就介紹到這了,更多數據分析的學習內容請搜索W3Cschool以前的文章或繼續(xù)瀏覽下面的相關文章。