
py中format是什么意思 什么是py2

大家好,今天來為大家分享py中format是什么意思的一些知識點,和什么是py2的問題解析,大家要是都明白,那么可以忽略,如果不太清楚的話可以看看本篇文章,相信很大概率...
大家好,今天來為大家分享py中format是什么意思的一些知識點,和什么是py2的問題解析,大家要是都明白,那么可以忽略,如果不太清楚的話可以看看本篇文章,相信很大概率可以解決您的問題,接下來我們就一起來看看吧!
源文件什么格式
源文件后綴大都根據(jù)編程語言本身的名字來命名,例如:
C語言源文件的后綴是.c;
C++語言(CPlusPlus)源文件的后綴是.cpp;
Java源文件的后綴是.java;
Python源文件的后綴是.py;
JavaScript源文件后置是.js。
python怎么運行py文件
在如何使用Python腳本轉(zhuǎn)換數(shù)據(jù)和命令行中,我們將深入探討如何使用Python腳本和命令行來轉(zhuǎn)換數(shù)據(jù)。
但是首先,值得提出一個您可能正在思考的問題:“Python如何適合命令行,為什么當我知道我可以使用IPython筆記本完成所有數(shù)據(jù)科學工作時,為什么還要使用命令行與Python進行交互?還是Jupyter實驗室?”
筆記本非常適合快速進行數(shù)據(jù)可視化和探索,但是Python腳本是將我們學到的東西投入生產(chǎn)的一種方式。假設您想建立一個網(wǎng)站,以幫助人們發(fā)布具有理想標題和提交時間的HackerNews帖子。為此,您需要腳本。
本教程假定您具有函數(shù)的基本知識,并且有一點命令行經(jīng)驗也不會受到損害。如果您以前從未使用過Python,請隨時查看我們涵蓋Python函數(shù)基礎的任務,或者更深入地研究我們的一些數(shù)據(jù)科學課程。最近,我們發(fā)布了兩個新的交互式命令行課程:“命令行元素”和“命令行中的文本處理”,因此如果您想更深入地研究命令行,我們也建議您
也就是說,不必過分擔心先決條件!我們將解釋我們正在做的所有事情,所以讓我們開始吧!
熟悉數(shù)據(jù)
HackerNews是一個站點,用戶可以在該站點上通過Internet(通常是有關(guān)技術(shù)和創(chuàng)業(yè)公司)提交文章,而其他人可以“贊揚”這些文章,表示他們喜歡它們。提交的投票越多,在社區(qū)中就越受歡迎。熱門文章進入HackerNews的“首頁”,在其他網(wǎng)站上它們更有可能被他人看到。
我們將使用的數(shù)據(jù)集是由ArnaudDrizard使用HackerNewsAPI編譯的,可以在此處找到。我們從數(shù)據(jù)中隨機抽取了10000行,并刪除了所有多余的列。我們的數(shù)據(jù)集只有四列:
submission_time-故事提交時。
upvotes-提交的投票數(shù)。
url—提交的基本域。
headline—提交的標題。用戶可以對其進行編輯,而不必與原始文章的標題相匹配。
我們將編寫腳本來回答三個關(guān)鍵問題:
哪些新聞最常出現(xiàn)在頭條新聞中?
哪些域名最常提交給HackerNews?
大多數(shù)文章什么時候提交?
切記:在編程時,有多種方法可以處理任務。在本教程中,我們將逐步解決這些問題,但是肯定還有其他方法同樣有效,因此請隨時嘗試并嘗試提出自己的方法!
使用命令行和Python腳本讀取數(shù)據(jù)
要加注星標,讓我們Transforming_Data_with_Python在桌面上創(chuàng)建一個文件夾。要使用命令行創(chuàng)建文件夾,可以使用mkdir命令,后跟文件夾名稱。例如,如果要創(chuàng)建一個名為的文件夾test,則可以導航到Desktop目錄,然后鍵入mkdirtest。
我們將稍后討論為什么創(chuàng)建文件夾,但是現(xiàn)在,讓我們使用cd命令導航到創(chuàng)建的文件夾。該cd命令允許我們使用命令行更改目錄。
盡管有多種使用命令行創(chuàng)建文件的方法,但我們可以利用一種稱為管道傳輸和重定向輸出的技術(shù)來一次完成兩件事:將輸出從stdout(命令行生成的標準輸出)重定向到文件中并創(chuàng)建一個新文件!換句話說,我們可以讓它創(chuàng)建一個新文件并使它的輸出成為該文件的內(nèi)容,而不是讓命令行僅打印其輸出。
要做到這一點,我們可以使用>和>>,這取決于我們想用文件來完成。如果文件不存在,兩者都會創(chuàng)建一個文件;但是,>將使用重定向的輸出覆蓋文件中已有的文本,同時>>將任何重定向的輸出附加到文件中。
我們希望將數(shù)據(jù)讀入該文件并創(chuàng)建一個描述性的文件名和函數(shù)名稱,因此我們將創(chuàng)建一個名為的函數(shù),load_data()并將其保存在名為的文件中read.py。讓我們使用讀取數(shù)據(jù)的命令行創(chuàng)建函數(shù)。為此,我們將使用該printf函數(shù)。(我們將使用printf它,因為它允許我們打印換行符和制表符,我們將使用它們來使腳本對自己和其他人更具可讀性)。
為此,我們可以在命令行中輸入以下內(nèi)容
printf"importpandasaspd\n\ndefload_data():\n\thn_stories=pd.read_csv('hn_stories.csv')\n\thn_stories.colummns=['submission_time','upvotes','url','headline']\n\treturn(hn_stores)\n">read.py
檢查上面的代碼,有很多事情要做。讓我們將其分解。在函數(shù)中,我們是:
a.請記住,我們要使腳本可讀,我們正在使用printf命令通過命令行生成一些輸出,以在生成輸出時保留格式。
b.進口大熊貓。
c.將數(shù)據(jù)集(hn_stories.csv)讀入pandas數(shù)據(jù)框。
d.使用df.columns列名添加到我們的數(shù)據(jù)幀。
e.創(chuàng)建一個名為的函數(shù)load_data(),其中包含用于讀取和處理數(shù)據(jù)集的代碼。
f.利用換行符(\n)和制表符(\t)保留格式,因此Python可以讀取腳本。
g.將輸出重定向printf到read.py使用>運算符調(diào)用的文件。由于read.py尚不存在,因此已創(chuàng)建文件。
運行上面的代碼后,我們可以catread.py在命令行中鍵入并執(zhí)行命令以檢查的內(nèi)容read.py。如果一切正常運行,我們的read.py文件將如下所示:
創(chuàng)造__init__.py
在該項目的其余部分,我們將創(chuàng)建更多腳本來回答我們的問題并使用該load_data()函數(shù)。盡管我們可以將該函數(shù)粘貼到使用該函數(shù)的每個文件中,但是如果我們正在處理的項目很大,則可能會變得非常麻煩。
為了解決這個問題,我們可以創(chuàng)建一個名為的文件__init__.py。本質(zhì)上,__init__.py允許文件夾將其目錄文件視為包。最簡單的形式__init__.py可以是一個空文件。它只需要存在就可以將目錄文件視為包。您可以在Python文檔中找到有關(guān)包和模塊的更多信息。
因為load_data()是中的函數(shù)read.py,所以我們可以使用導入包的相同方法來導入該函數(shù):fromreadimportload_data()。
還記得使用命令行創(chuàng)建文件的多種方法嗎?我們可以使用另一個命令來創(chuàng)建文件__init__.py這次,我們將使用該touch命令來創(chuàng)建文件。touch是一個在您運行命令后立即為您創(chuàng)建一個空文件的命令:
探索標題中的單詞
現(xiàn)在,我們已經(jīng)創(chuàng)建了一個腳本來讀取和處理數(shù)據(jù)以及創(chuàng)建的數(shù)據(jù)__init__.py,我們可以開始分析數(shù)據(jù)了!我們要探索的第一件事是標題中出現(xiàn)的獨特詞。為此,我們要執(zhí)行以下操作:
1)count.py使用命令行創(chuàng)建一個名為的文件。
2)load_data從導入read.py,并調(diào)用函數(shù)以讀取數(shù)據(jù)集。
3)將所有標題合并為一個長長的字符串。當您合并標題時,我們希望在每個標題之間留一個空格。在此步驟中,我們將使用Series.str.cat連接字符串。
4)將長字符串拆分成單詞。
5)使用Counter類可以計算每個單詞在字符串中出現(xiàn)的次數(shù)。
6)使用該.most_common()方法將100個最常用的單詞存儲到wordCount。
如果使用命令行創(chuàng)建此文件,則外觀如下:
printf"fromreadimportload_data\nfromcollectionsimportCounter\n\nstories=load_data()\nheadlines=stories['headline'].str.cat(sep='').lower()\nwordCount=Counter(headlines.split('')).most_common(100)\nprint(wordCount)\n">count.py
運行上面的代碼后,您可以catcount.py在命令行中鍵入并執(zhí)行命令以檢查的內(nèi)容count.py。如果一切正常運行,您的count.py文件將如下所示:
現(xiàn)在,我們已經(jīng)創(chuàng)建了Python腳本,我們可以從命令行運行腳本以獲取一百個最常用單詞的列表。要運行腳本,我們從命令行鍵入pythoncount.py命令。
腳本運行后,您將看到以下打印結(jié)果:
[('the',2045),('to',1641),('a',1276),('of',1170),('for',1140),('in',1036),('and',936),('',733),('is',620),('on',568),('hn:',537),('with',537),('how',526),('-',487),('your',480),('you',392),('ask',371),('from',310),('new',304),('google',303),('why',262),('what',258),('an',243),('are',223),('by',219),('at',213),('show',205),('web',192),('it',192),('–',184),('do',183),('app',178),('i',173),('as',161),('not',160),('that',160),('data',157),('about',154),('be',154),('facebook',150),('startup',147),('my',131),('|',127),('using',125),('free',125),('online',123),('apple',123),('get',122),('can',115),('open',114),('will',112),('android',110),('this',110),('out',109),('we',106),('its',102),('now',101),('best',101),('up',100),('code',98),('have',97),('or',96),('one',95),('more',93),('first',93),('all',93),('software',93),('make',92),('iphone',91),('twitter',91),('should',91),('video',90),('social',89),('&',88),('internet',88),('us',88),('mobile',88),('use',86),('has',84),('just',80),('world',79),('design',79),('business',79),('5',78),('apps',77),('source',77),('cloud',76),('into',76),('api',75),('top',74),('tech',73),('javascript',73),('like',72),('programming',72),('windows',72),('when',71),('ios',70),('live',69),('future',69),('most',68)]
在我們的網(wǎng)站上滾動瀏覽它們會有些尷尬,但是您可能會注意到最常見的詞,例如等等。這些詞被稱為停用詞the,toafor這些詞對人類語音很有用,但對數(shù)據(jù)分析沒有任何幫助。您可以在我們的spaCy教程中找到更多有關(guān)停用詞的信息;如果要擴展此項目,則從我們的分析中刪除停用詞將是一個有趣的下一步。
即使包含了停用詞,我們也可以發(fā)現(xiàn)一些趨勢。除了停用詞之外,這些詞中的絕大多數(shù)都是與技術(shù)和創(chuàng)業(yè)相關(guān)的術(shù)語。考慮到HackerNews專注于科技創(chuàng)業(yè)公司,這并不奇怪,但是我們可以看到一些有趣的特定趨勢。例如,谷歌是該數(shù)據(jù)集中最常提及的品牌。Facebook,Apple和Twitter等其他品牌也是討論的熱門話題。
探索域提交
現(xiàn)在我們已經(jīng)探索了不同的標題并顯示了前100個最常用的詞,現(xiàn)在我們可以探索域提交了!為此,我們可以執(zhí)行以下操作:
1)domains.py使用命令行創(chuàng)建一個名為的文件。
2)load_data從導入read.py,并調(diào)用函數(shù)以讀取數(shù)據(jù)集。
3)使用value_counts()大熊貓中的方法來計算列中每個值的出現(xiàn)次數(shù)。
4)遍歷該系列并打印索引值及其關(guān)聯(lián)的總數(shù)。
這是命令行形式的外觀:
printf"fromreadimportload_data\n\nstories=load_data()\ndomains=stories['url'].value_counts()\nforname,rowindomains.items():\n\tprint('{0}:{1}'.format(name,row))\n">domains.py
再一次,如果我們catdomains.py在命令行中輸入來檢查domains.py,我們應該看到:
探索提交時間
我們想知道大多數(shù)文章何時提交。一種簡單的重組方法是查看文章的提交時間。為了弄清楚這一點,我們需要使用該submission_time列。
該submission_time列包含如下時間戳:2011-11-09T21:56:22Z。這些時間以UTC表示,UTC是大多數(shù)軟件用于保持一致性的通用時區(qū)(想象一個數(shù)據(jù)庫中填充的時間都具有不同的時區(qū);要使用它會非常麻煩)。
要從時間戳獲取小時,我們可以使用該dateutil庫。中的parser模塊dateutil包含parse函數(shù),該函數(shù)可以帶一個時間戳,如何使用Python腳本轉(zhuǎn)換數(shù)據(jù)和命令行https://www.aaa-cg.com.cn/data/2304.html并返回一個datetime對象。這是文檔的鏈接。解析時間戳后,hour結(jié)果日期對象的屬性將告訴您文章提交的時間。
為此,我們可以執(zhí)行以下操作:
1)times.py使用命令行創(chuàng)建一個名為的文件。
2)編寫一個函數(shù)以從時間戳中提取小時。此函數(shù)應首先用于dateutil.parser.parse解析時間戳,然后從結(jié)果datetime對象中提取小時,然后使用來返回小時.hour。
3)使用pandasapply()方法創(chuàng)建提交時間列。
4)使用value_counts()大熊貓中的方法來計算每小時發(fā)生的次數(shù)。
5)打印結(jié)果。
我們在命令行中執(zhí)行以下操作:
printf"fromdateutil.parserimportparse\nfromreadimportload_data\n\n\ndefextract_hour(timestamp):\n\tdatetime=parse(timestamp)\n\thour=datetime.hour\n\treturnhour\n\nstories=load_data()\nstories['hour']=stories['submission_time'].apply(extract_hour)\ntime=stories['hour'].value_counts()\nprint(time)">times.py
這是它看起來像一個單獨.py文件的樣子(如上所述,您可以通過cattimes.py從命令行運行以檢查文件來進行確認):
現(xiàn)在,我們已經(jīng)創(chuàng)建了Python腳本,我們可以從命令行運行腳本,以獲取特定時間內(nèi)發(fā)布了多少篇文章的列表。為此,您可以從命令行鍵入pythontimes.py命令。運行此腳本,您將看到以下結(jié)果:
您會注意到大多數(shù)提交內(nèi)容是在下午發(fā)布的。但是請記住,這些時間是UTC時間。如果您有興趣擴展此項目,請嘗試在腳本中添加一個部分,以將UTC的輸出轉(zhuǎn)換為本地時區(qū)。
下一步
在如何使用Python腳本轉(zhuǎn)換數(shù)據(jù)和命令行中,我們探索了數(shù)據(jù)并建立了一個短腳本目錄,這些短腳本可相互配合以提供所需的答案。這是構(gòu)建我們的數(shù)據(jù)分析項目的生產(chǎn)版本的第一步。
但是,當然,這僅僅是開始!在如何使用Python腳本轉(zhuǎn)換數(shù)據(jù)和命令行中,我們沒有使用過upvotes數(shù)據(jù),因此這是擴展分析范圍的一個不錯的下一步:
a.標題長度最大才能獲得最多投票?
b.提交時間最多的是什么?
c.投票總數(shù)隨時間變化如何?
我們鼓勵您結(jié)合自己的問題,并在繼續(xù)探索此數(shù)據(jù)集時發(fā)揮創(chuàng)造力!
https://www.toutiao.com/i6831049808313057804/
py是什么日期
py提供了tome和calendar模塊用來格式化日期和時間的
時鐘代碼保存什么格式
時鐘代碼的保存格式可以是多種,具體取決于編程語言和開發(fā)環(huán)境。下面以常見的編程語言為例介紹一些可能的保存格式:
1.C語言:通常將時鐘代碼保存為.c文件格式,可以使用任何文本編輯器進行編輯保存。在使用C語言編寫時鐘程序時,需要包含<time.h>頭文件,并使用time庫中的函數(shù)來獲取和顯示當前的時間。
2.Python語言:通常將時鐘代碼保存為.py文件格式,可以使用任何文本編輯器進行編輯保存。在使用Python編寫時鐘程序時,可以使用datetime模塊或者time模塊中的函數(shù)來獲取和處理時間,并使用GUI庫如Tkinter等來實現(xiàn)圖形界面。
3.Java語言:通常將時鐘代碼保存為.java文件格式,可以使用Java集成開發(fā)環(huán)境(IDE)如Eclipse、IntelliJIDEA等進行編輯保存。在使用Java編寫時鐘程序時,需要使用java.util包或者java.time包中的類和方法來獲取和處理時間,并使用Swing或JavaFX等GUI庫來實現(xiàn)圖形界面。
需要注意的是,在保存時鐘代碼時,應該按照編程語言和開發(fā)環(huán)境的規(guī)范進行命名和保存,以便后續(xù)的編譯和執(zhí)行。同時,應該注意備份和版本控制,以免代碼丟失或出現(xiàn)錯誤。
npz是啥
npz實際上是numpy提供的數(shù)組存儲方式,簡單的可看做是一系列npz數(shù)據(jù)的組合,利用npz.load函數(shù)讀取后得到一個類似字典的對象,可以通過關(guān)鍵字進行值查詢,關(guān)鍵字對應的值其實就是一個npz數(shù)據(jù)。
如果用keras自帶的example(fromkeras.datasetsimportmnist,在mnist.py下的load_data函數(shù)),會使用這種格式。
什么是py2
無論是py2還是py3,都使用unicode作為內(nèi)存編碼,簡稱內(nèi)碼。保存在python解釋器內(nèi)存中的文本,輸出到屏幕、編輯器,或者保存成文件的時候,都要將內(nèi)碼轉(zhuǎn)換成utf8或者gbk等編碼格式;同樣,python解釋器從輸入設備接收文本,或者從文件讀取文本的時候,都要將utf8或者gbk等編碼轉(zhuǎn)換成unicode編碼格式。
py中format是什么意思的介紹就聊到這里吧,感謝你花時間閱讀本站內(nèi)容,更多關(guān)于什么是py2、py中format是什么意思的信息別忘了在本站進行查找哦。
本文鏈接:http://www.wzyaohuidianqi.cn/ke/3176.html
