python匯總函數(shù)名稱 python中函數(shù)大全

Python 幾個(gè)重要的內(nèi)置函數(shù)

在學(xué)習(xí)Python的過程中,有幾個(gè)比較重要的內(nèi)置函數(shù):help()函數(shù)、dir()函數(shù)、input()與raw_input()函數(shù)、print()函數(shù)、type()函數(shù)。

創(chuàng)新互聯(lián)自2013年起,先為海城等服務(wù)建站,海城等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為海城企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。

第一、help()函數(shù)

Help()函數(shù)的參數(shù)分為兩種:如果傳一個(gè)字符串做參數(shù)的話,它會自動搜索以這個(gè)字符串命名的模塊、方法等;如果傳入的是一個(gè)對象,就會顯示這個(gè)對象的類型的幫助。比如輸入help(‘print’),它就會尋找以‘print’為名的模塊、類等,找不到就會看到提示信息;而print在Python里是一個(gè)保留字,和pass、return同等,而非對象,所以help(print)也會報(bào)錯。

第二、dir()函數(shù)

dir()函數(shù)返回任意對象的屬性和方法列表,包含模塊對象、函數(shù)對象、字符串對象、列表對象、字典對象等。盡管查找和導(dǎo)入模塊相對容易,但是記住每個(gè)模塊包含什么卻不是這么簡單,您并不希望總是必須查看源代碼來找出答案。Python提供了一種方法,可以使用內(nèi)置的dir()函數(shù)來檢查模塊的內(nèi)容,當(dāng)你為dir()提供一個(gè)模塊名的時(shí)候,它返回模塊定義的屬性列表。dir()函數(shù)適用于所有對象的類型,包含字符串、整數(shù)、列表、元組、字典、函數(shù)、定制類、類實(shí)例和類方法。

第三、input與raw_input函數(shù)

都是用于讀取用戶輸入的,不同的是input()函數(shù)期望用戶輸入的是一個(gè)有效的表達(dá)式,而raw_input()函數(shù)是將用戶的輸入包裝成一個(gè)字符串。

第四、Print()函數(shù)

Print在Python3版本之間是作為Python語句使用的,在Python3里print是作為函數(shù)使用的。

第五、type()函數(shù)

Type()函數(shù)返回任意對象的數(shù)據(jù)類型。在types模塊中列出了可能的數(shù)據(jù)類型,這對于處理多種數(shù)據(jù)類型的函數(shù)非常有用,它通過返回類型對象來做到這一點(diǎn),可以將這個(gè)類型對象與types模塊中定義類型相比較。

太全了!Python3常用內(nèi)置函數(shù)總結(jié)

數(shù)學(xué)相關(guān)

abs(a) : 求取絕對值。abs(-1)

max(list) : 求取list最大值。max([1,2,3])

min(list) : 求取list最小值。min([1,2,3])

sum(list) : 求取list元素的和。 sum([1,2,3]) 6

sorted(list) : 排序,返回排序后的list。

len(list) : list長度,len([1,2,3])

divmod(a,b): 獲取商和余數(shù)。 divmod(5,2) (2,1)

pow(a,b) : 獲取乘方數(shù)。pow(2,3) 8

round(a,b) : 獲取指定位數(shù)的小數(shù)。a代表浮點(diǎn)數(shù),b代表要保留的位數(shù)。round(3.1415926,2) 3.14

range(a[,b]) : 生成一個(gè)a到b的數(shù)組,左閉右開。range(1,10) [1,2,3,4,5,6,7,8,9]

類型轉(zhuǎn)換

int(str) : 轉(zhuǎn)換為int型。int('1') 1

float(int/str) : 將int型或字符型轉(zhuǎn)換為浮點(diǎn)型。float('1') 1.0

str(int) : 轉(zhuǎn)換為字符型。str(1) '1'

bool(int) : 轉(zhuǎn)換為布爾類型。 str(0) False str(None) False

bytes(str,code) : 接收一個(gè)字符串,與所要編碼的格式,返回一個(gè)字節(jié)流類型。bytes('abc', 'utf-8') b'abc' bytes(u'爬蟲', 'utf-8') b'xe7x88xacxe8x99xab'

list(iterable) : 轉(zhuǎn)換為list。 list((1,2,3)) [1,2,3]

iter(iterable): 返回一個(gè)可迭代的對象。 iter([1,2,3]) list_iterator object at 0x0000000003813B00

dict(iterable) : 轉(zhuǎn)換為dict。 dict([('a', 1), ('b', 2), ('c', 3)]) {'a':1, 'b':2, 'c':3}

enumerate(iterable) : 返回一個(gè)枚舉對象。

tuple(iterable) : 轉(zhuǎn)換為tuple。 tuple([1,2,3]) (1,2,3)

set(iterable) : 轉(zhuǎn)換為set。 set([1,4,2,4,3,5]) {1,2,3,4,5} set({1:'a',2:'b',3:'c'}) {1,2,3}

hex(int) : 轉(zhuǎn)換為16進(jìn)制。hex(1024) '0x400'

oct(int) : 轉(zhuǎn)換為8進(jìn)制。 oct(1024) '0o2000'

bin(int) : 轉(zhuǎn)換為2進(jìn)制。 bin(1024) '0b10000000000'

chr(int) : 轉(zhuǎn)換數(shù)字為相應(yīng)ASCI碼字符。 chr(65) 'A'

ord(str) : 轉(zhuǎn)換ASCI字符為相應(yīng)的數(shù)字。 ord('A') 65

相關(guān)操作

eval****() : 執(zhí)行一個(gè)表達(dá)式,或字符串作為運(yùn)算。 eval('1+1') 2

exec() : 執(zhí)行python語句。 exec('print("Python")') Python

filter(func, iterable) : 通過判斷函數(shù)fun,篩選符合條件的元素。 filter(lambda x: x3, [1,2,3,4,5,6]) filter object at 0x0000000003813828

map(func, *iterable) : 將func用于每個(gè)iterable對象。 map(lambda a,b: a+b, [1,2,3,4], [5,6,7]) [6,8,10]

zip(*iterable) : 將iterable分組合并。返回一個(gè)zip對象。 list(zip([1,2,3],[4,5,6])) [(1, 4), (2, 5), (3, 6)]

type():返回一個(gè)對象的類型。

id(): 返回一個(gè)對象的唯一標(biāo)識值。

hash(object):返回一個(gè)對象的hash值,具有相同值的object具有相同的hash值。 hash('python') 7070808359261009780

help():調(diào)用系統(tǒng)內(nèi)置的幫助系統(tǒng)。

isinstance():判斷一個(gè)對象是否為該類的一個(gè)實(shí)例。

issubclass():判斷一個(gè)類是否為另一個(gè)類的子類。

globals() : 返回當(dāng)前全局變量的字典。

next(iterator[, default]) : 接收一個(gè)迭代器,返回迭代器中的數(shù)值,如果設(shè)置了default,則當(dāng)?shù)髦械脑乇闅v后,輸出default內(nèi)容。

reversed(sequence) : 生成一個(gè)反轉(zhuǎn)序列的迭代器。 reversed('abc') ['c','b','a']

python 常用的系統(tǒng)函數(shù)有哪些

1.常用內(nèi)置函數(shù):(不用import就可以直接使用)

help(obj) 在線幫助, obj可是任何類型

callable(obj) 查看一個(gè)obj是不是可以像函數(shù)一樣調(diào)用

repr(obj) 得到obj的表示字符串,可以利用這個(gè)字符串eval重建該對象的一個(gè)拷貝

eval_r(str) 表示合法的python表達(dá)式,返回這個(gè)表達(dá)式

dir(obj) 查看obj的name space中可見的name

hasattr(obj,name) 查看一個(gè)obj的name space中是否有name

getattr(obj,name) 得到一個(gè)obj的name space中的一個(gè)name

setattr(obj,name,value) 為一個(gè)obj的name space中的一個(gè)name指向vale這個(gè)object

delattr(obj,name) 從obj的name space中刪除一個(gè)name

vars(obj) 返回一個(gè)object的name space。用dictionary表示

locals() 返回一個(gè)局部name space,用dictionary表示

globals() 返回一個(gè)全局name space,用dictionary表示

type(obj) 查看一個(gè)obj的類型

isinstance(obj,cls) 查看obj是不是cls的instance

issubclass(subcls,supcls) 查看subcls是不是supcls的子類

類型轉(zhuǎn)換函數(shù)

chr(i) 把一個(gè)ASCII數(shù)值,變成字符

ord(i) 把一個(gè)字符或者unicode字符,變成ASCII數(shù)值

oct(x) 把整數(shù)x變成八進(jìn)制表示的字符串

hex(x) 把整數(shù)x變成十六進(jìn)制表示的字符串

str(obj) 得到obj的字符串描述

list(seq) 把一個(gè)sequence轉(zhuǎn)換成一個(gè)list

tuple(seq) 把一個(gè)sequence轉(zhuǎn)換成一個(gè)tuple

dict(),dict(list) 轉(zhuǎn)換成一個(gè)dictionary

int(x) 轉(zhuǎn)換成一個(gè)integer

long(x) 轉(zhuǎn)換成一個(gè)long interger

float(x) 轉(zhuǎn)換成一個(gè)浮點(diǎn)數(shù)

complex(x) 轉(zhuǎn)換成復(fù)數(shù)

max(...) 求最大值

min(...) 求最小值

用于執(zhí)行程序的內(nèi)置函數(shù)

complie 如果一段代碼經(jīng)常要使用,那么先編譯,再運(yùn)行會更快。

2.和操作系統(tǒng)相關(guān)的調(diào)用

系統(tǒng)相關(guān)的信息模塊 import sys

sys.argv是一個(gè)list,包含所有的命令行參數(shù).

sys.stdout sys.stdin sys.stderr 分別表示標(biāo)準(zhǔn)輸入輸出,錯誤輸出的文件對象.

sys.stdin.readline() 從標(biāo)準(zhǔn)輸入讀一行 sys.stdout.write("a") 屏幕輸出a

sys.exit(exit_code) 退出程序

sys.modules 是一個(gè)dictionary,表示系統(tǒng)中所有可用的module

sys.platform 得到運(yùn)行的操作系統(tǒng)環(huán)境

sys.path 是一個(gè)list,指明所有查找module,package的路徑.

操作系統(tǒng)相關(guān)的調(diào)用和操作 import os

os.environ 一個(gè)dictionary 包含環(huán)境變量的映射關(guān)系 os.environ["HOME"] 可以得到環(huán)境變量HOME的值

os.chdir(dir) 改變當(dāng)前目錄 os.chdir('d:\\outlook') 注意windows下用到轉(zhuǎn)義

os.getcwd() 得到當(dāng)前目錄

os.getegid() 得到有效組id os.getgid() 得到組id

os.getuid() 得到用戶id os.geteuid() 得到有效用戶id

os.setegid os.setegid() os.seteuid() os.setuid()

os.getgruops() 得到用戶組名稱列表

os.getlogin() 得到用戶登錄名稱

os.getenv 得到環(huán)境變量

os.putenv 設(shè)置環(huán)境變量

os.umask 設(shè)置umask

os.system(cmd) 利用系統(tǒng)調(diào)用,運(yùn)行cmd命令

操作舉例:

os.mkdir('/tmp/xx') os.system("echo 'hello' /tmp/xx/a.txt") os.listdir('/tmp/xx')

os.rename('/tmp/xx/a.txt','/tmp/xx/b.txt') os.remove('/tmp/xx/b.txt') os.rmdir('/tmp/xx')

用python編寫一個(gè)簡單的shell

#!/usr/bin/python

import os, sys

cmd = sys.stdin.readline()

while cmd:

os.system(cmd)

cmd = sys.stdin.readline()

用os.path編寫平臺無關(guān)的程序

os.path.abspath("1.txt") == os.path.join(os.getcwd(), "1.txt")

os.path.split(os.getcwd()) 用于分開一個(gè)目錄名稱中的目錄部分和文件名稱部分。

os.path.join(os.getcwd(), os.pardir, 'a', 'a.doc') 全成路徑名稱.

os.pardir 表示當(dāng)前平臺下上一級目錄的字符 ..

os.path.getctime("/root/1.txt") 返回1.txt的ctime(創(chuàng)建時(shí)間)時(shí)間戳

os.path.exists(os.getcwd()) 判斷文件是否存在

os.path.expanduser('~/dir') 把~擴(kuò)展成用戶根目錄

os.path.expandvars('$PATH') 擴(kuò)展環(huán)境變量PATH

os.path.isfile(os.getcwd()) 判斷是否是文件名,1是0否

os.path.isdir('c:\Python26\temp') 判斷是否是目錄,1是0否

os.path.islink('/home/huaying/111.sql') 是否是符號連接 windows下不可用

os.path.ismout(os.getcwd()) 是否是文件系統(tǒng)安裝點(diǎn) windows下不可用

os.path.samefile(os.getcwd(), '/home/huaying') 看看兩個(gè)文件名是不是指的是同一個(gè)文件

os.path.walk('/home/huaying', test_fun, "a.c")

遍歷/home/huaying下所有子目錄包括本目錄,對于每個(gè)目錄都會調(diào)用函數(shù)test_fun.

例:在某個(gè)目錄中,和他所有的子目錄中查找名稱是a.c的文件或目錄。

def test_fun(filename, dirname, names): //filename即是walk中的a.c dirname是訪問的目錄名稱

if filename in names: //names是一個(gè)list,包含dirname目錄下的所有內(nèi)容

print os.path.join(dirname, filename)

os.path.walk('/home/huaying', test_fun, "a.c")

文件操作

打開文件

f = open("filename", "r") r只讀 w寫 rw讀寫 rb讀二進(jìn)制 wb寫二進(jìn)制 w+寫追加

讀寫文件

f.write("a") f.write(str) 寫一字符串 f.writeline() f.readlines() 與下read類同

f.read() 全讀出來 f.read(size) 表示從文件中讀取size個(gè)字符

f.readline() 讀一行,到文件結(jié)尾,返回空串. f.readlines() 讀取全部,返回一個(gè)list. list每個(gè)元素表示一行,包含"\n"\

f.tell() 返回當(dāng)前文件讀取位置

f.seek(off, where) 定位文件讀寫位置. off表示偏移量,正數(shù)向文件尾移動,負(fù)數(shù)表示向開頭移動。

where為0表示從開始算起,1表示從當(dāng)前位置算,2表示從結(jié)尾算.

f.flush() 刷新緩存

關(guān)閉文件

f.close()

regular expression 正則表達(dá)式 import re

簡單的regexp

p = re.compile("abc") if p.match("abc") : print "match"

上例中首先生成一個(gè)pattern(模式),如果和某個(gè)字符串匹配,就返回一個(gè)match object

除某些特殊字符metacharacter元字符,大多數(shù)字符都和自身匹配。

這些特殊字符是 。^ $ * + ? { [ ] \ | ( )

字符集合(用[]表示)

列出字符,如[abc]表示匹配a或b或c,大多數(shù)metacharacter在[]中只表示和本身匹配。例:

a = ".^$*+?{\\|()" 大多數(shù)metachar在[]中都和本身匹配,但"^[]\"不同

p = re.compile("["+a+"]")

for i in a:

if p.match(i):

print "[%s] is match" %i

else:

print "[%s] is not match" %i

在[]中包含[]本身,表示"["或者"]"匹配.用

表示.

^出現(xiàn)在[]的開頭,表示取反.[^abc]表示除了a,b,c之外的所有字符。^沒有出現(xiàn)在開頭,即于身身匹配。

-可表示范圍.[a-zA-Z]匹配任何一個(gè)英文字母。[0-9]匹配任何數(shù)字。

\在[]中的妙用。

\d [0-9]

\D [^0-9]

\s [ \t\n\r\f\v]

\S [^ \t\n\r\f\v]

\w [a-zA-Z0-9_]

\W [^a-zA-Z0-9_]

\t 表示和tab匹配, 其他的都和字符串的表示法一致

\x20 表示和十六進(jìn)制ascii 0x20匹配

有了\,可以在[]中表示任何字符。注:單獨(dú)的一個(gè)"."如果沒有出現(xiàn)[]中,表示出了換行\(zhòng)n以外的匹配任何字符,類似[^\n].

regexp的重復(fù)

{m,n}表示出現(xiàn)m個(gè)以上(含m個(gè)),n個(gè)以下(含n個(gè)). 如ab{1,3}c和abc,abbc,abbbc匹配,不會與ac,abbbc匹配。

m是下界,n是上界。m省略表下界是0,n省略,表上界無限大。

*表示{,} +表示{1,} ?表示{0,1}

最大匹配和最小匹配 python都是最大匹配,如果要最小匹配,在*,+,?,{m,n}后面加一個(gè)?.

match object的end可以得到匹配的最后一個(gè)字符的位置。

re.compile("a*").match('aaaa').end() 4 最大匹配

re.compile("a*?").match('aaaa').end() 0 最小匹配

使用原始字符串

字符串表示方法中用\\表示字符\.大量使用影響可讀性。

解決方法:在字符串前面加一個(gè)r表示raw格式。

a = r"\a" print a 結(jié)果是\a

a = r"\"a" print a 結(jié)果是\"a

使用re模塊

先用re.compile得到一個(gè)RegexObject 表示一個(gè)regexp

后用pattern的match,search的方法,得到MatchObject

再用match object得到匹配的位置,匹配的字符串等信息

RegxObject常用函數(shù):

re.compile("a").match("abab") 如果abab的開頭和re.compile("a")匹配,得到MatchObject

_sre.SRE_Match object at 0x81d43c8

print re.compile("a").match("bbab")

None 注:從str的開頭開始匹配

re.compile("a").search("abab") 在abab中搜索第一個(gè)和re_obj匹配的部分

_sre.SRE_Match object at 0x81d43c8

print re.compile("a").search("bbab")

_sre.SRE_Match object at 0x8184e18 和match()不同,不必從開頭匹配

re_obj.findall(str) 返回str中搜索所有和re_obj匹配的部分.

返回一個(gè)tuple,其中元素是匹配的字符串.

MatchObject的常用函數(shù)

m.start() 返回起始位置,m.end()返回結(jié)束位置(不包含該位置的字符).

m.span() 返回一個(gè)tuple表示(m.start(), m.end())

m.pos(), m.endpos(), m.re(), m.string()

m.re().search(m.string(), m.pos(), m.endpos()) 會得到m本身

m.finditer()可以返回一個(gè)iterator,用來遍歷所有找到的MatchObject.

for m in re.compile("[ab]").finditer("tatbxaxb"):

print m.span()

高級regexp

| 表示聯(lián)合多個(gè)regexp. A B兩個(gè)regexp,A|B表示和A匹配或者跟B匹配.

^ 表示只匹配一行的開始行首,^只有在開頭才有此特殊意義。

$ 表示只匹配一行的結(jié)尾

\A 表示只匹配第一行字符串的開頭 ^匹配每一行的行首

\Z 表示只匹配行一行字符串的結(jié)尾 $匹配第一行的行尾

\b 只匹配詞的邊界 例:\binfo\b 只會匹配"info" 不會匹配information

\B 表示匹配非單詞邊界

示例如下:

print re.compile(r"\binfo\b").match("info ") #使用raw格式 \b表示單詞邊界

_sre.SRE_Match object at 0x817aa98

print re.compile("\binfo\b").match("info ") #沒有使用raw \b表示退格符號

None

print re.compile("\binfo\b").match("\binfo\b ")

_sre.SRE_Match object at 0x8174948

分組(Group) 示例:re.compile("(a(b)c)d").match("abcd").groups() ('abc', 'b')

#!/usr/local/bin/python

import re

x = """

name: Charles

Address: BUPT

name: Ann

Address: BUPT

"""

#p = re.compile(r"^name:(.*)\n^Address:(.*)\n", re.M)

p = re.compile(r"^name:(?P.*)\n^Address:(?P.*)\n", re.M)

for m in p.finditer(x):

print m.span()

print "here is your friends list"

print "%s, %s"%m.groups()

Compile Flag

用re.compile得到RegxObject時(shí),可以有一些flag用來調(diào)整RegxObject的詳細(xì)特征.

DOTALL, S 讓.匹配任意字符,包括換行符\n

IGNORECASE, I 忽略大小寫

LOCALES, L 讓\w \W \b \B和當(dāng)前的locale一致

MULTILINE, M 多行模式,只影響^和$(參見上例)

VERBOSE, X verbose模式

python自定義函數(shù)有哪些?

Python的自定義函數(shù)格式中規(guī)中矩,用def引導(dǎo)自定義函數(shù)名,用括號給出該函數(shù)的參數(shù),在冒號后換行通過縮進(jìn)確定函數(shù)體。在格式上和條件判斷語句有些相似。

如果函數(shù)名和變量名沖突了,相當(dāng)于重新賦值。而python解釋是從上到下的,也就是說此時(shí)誰在下面誰占用這個(gè)變量名。剩下的那個(gè)就只能在內(nèi)存中等待垃圾回收了。

自定義函數(shù)的參數(shù):

按道理來說,即使Python不嚴(yán)格要求定義函數(shù)參數(shù),但這方面的知識有助于理解自定義函數(shù)中參數(shù)操作的情況,還是應(yīng)該說明一下的。

可以簡單地理解為在定義函數(shù)時(shí)括號中聲明的參數(shù)是我們在函數(shù)使用中會用到的參數(shù),在調(diào)用函數(shù)時(shí)括號中的變量就是參加函數(shù)運(yùn)算用到的變量,換個(gè)名字參數(shù)(用于定義)和變量(用于調(diào)用)就足以理解了。

Python字典中幾個(gè)常用函數(shù)總結(jié)

1、get() 返回指定鍵的值,如果值不在字典中返回default值。

語法:dict.get(key,default=None)

參數(shù):

key 字典中要查找的鍵。

default 如果指定鍵的值不存在時(shí),返回該默認(rèn)值值。

例:

dict={'Name':'alex','Age':21}

print("Name is:%s"% dict.get('Name')+"\n"+ "Age is:%d"% dict.get('Age'))

顯示結(jié)果為:

Name is:alex

Age is:21

2、update() 將一個(gè)字典中的值更新到另一個(gè)字典中。

語法:dict.update(dict2)

參數(shù):

dict2 添加到指定字典dict里的字典。

例:

dict={'Name':'alex','Age':21}

dict2={'Sex':'female'}

dict.update(dict2)

print("Value is %s" % dict)

顯示結(jié)果為:

Value is {'Name': 'alex', 'Age': 21, 'Sex': 'female'}

pandas常用函數(shù)匯總

pandas官方文檔:

對常用函數(shù)做了匯總,每個(gè)函數(shù)的參數(shù)可能不是全的,但是常用的,不常用的沒總結(jié),如有問題,請不吝賜教,謝謝!

1、創(chuàng)建Series

? 通用函數(shù):pd.Series(values,index)

1)pd.Series([1,2,3],index=[‘a(chǎn)’,‘b’,‘c‘])

2)pd.Series(np.array([1,2,3]),index=[‘a(chǎn)’,‘b’,‘c‘])

3)pd.Series({ 'a':1,? 'b':2,? 'c':3})

? ? Series轉(zhuǎn)字典:Series.to_dict()

說明:Series的values參數(shù)是python中常見的一維數(shù)據(jù)類型。

2、屬性

1)Series.values ---array([1,2,3])

? ? ?? Series的values是array類型

2)Series.index---index([‘a(chǎn)’,‘b’,‘c‘])

? ? ?? 未指定index時(shí),自動生成 0-(N-1)的整數(shù)索引,

? ? ?? 指定 index時(shí),使用指定索引。

3、Series的索引與切片

?? Series[0] / Series['a']? : Sereis可以位置索引或標(biāo)簽索引,也可以進(jìn)行切片操作

1、創(chuàng)建DataFrame

1) 創(chuàng)建DataFrame的通用函數(shù):

df = pd.DataFrame(values,index,columns)

pd.dataFrame([[1,2,3],[4,5,6],[7,8,9]],index=['a','b','c'],columns=['bj','sh','sz'])

pd.dataFrame(np.arange(1,10).reshape(3,3),index=['a','b','c'],columns=['bj','sh','sz'])

pd.dataFrame('bj':[1,4,7],'sh':[2,5,8],'sz':[3,6,9],index=['a','b','c'])

說明:創(chuàng)建方法與Sries類似,Series的values參數(shù)是python中常見的一維數(shù)據(jù)類型,DataFrame的values參數(shù)是python中常見的二維數(shù)據(jù)類型。

2) 通過網(wǎng)頁中復(fù)制數(shù)據(jù)快捷創(chuàng)建

? ? import webbrowser

? ? link = ''

? ? webbrowser.open(link)

? ? 打開界面進(jìn)行復(fù)制,將數(shù)據(jù)復(fù)制到粘貼板中

? ? df = pd.read_clipboard() ? #從粘貼板中讀取數(shù)據(jù)

3)通過Series創(chuàng)建DataFrame

? ? df = pd.DataFrame([s1,s2,s3],columns=['bj','sh','sz'])

? ? 注意:單獨(dú)的s1,s2,s3是縱向排列的的Series,但是在DataFrame中是橫向排列的。

? ? 自己總結(jié):Series除了打印出來是Series格式外,其他時(shí)候可以直接當(dāng)作list來操作。

2、屬性

1)df.columns

? ? 通過columns生成新的DataFrame

? ? df_new = pd.DataFrame(df,columns=['x1','x2'])

? ? 或者df_new = df[['x1','x2']]

2)df.shape? 顯示行列數(shù)

3)df.head() ? 默認(rèn)顯示前5行

4)df.tail() ? ? 默認(rèn)顯示后5行

3、獲取DataFrame的列

1)獲取DataFrame某一列

? ? ? df.x1或df['x1']:返回值是Series,可以理解為一個(gè)DataFrame是由多個(gè)Series組成的。

? 2) 獲取DataFrame某幾列

? ? ? df_new = df[['x1','x2','x3']]

4、為某列賦值

? 1) df['x1'] = range(10)

? 2) df['x1'] = numpy.arange(10)

? 3) df['x1'] = pd.Series(np.arange(10))

? 說明:類似于創(chuàng)建Series

5、為某列對應(yīng)的特定行重新賦值

? ? df['x1'] = pd.Series([2,3],index=[0,1])

? ? 將列為x1,行索引為0和1的值改為2,3

6、獲取DadaFrame的行

? for row in DataFrame.iterrows():

? ? ? ? ? print(row[0],row[1])

? #每個(gè)row是一個(gè)元祖,包含2個(gè)元素,row[0]是整型索引,row[1]是Series,所以從行的角度也可以看出,一個(gè)DataFrame是由多個(gè)Series組成的。

7、DataFrame的轉(zhuǎn)置

? df_new = df.T

1、粘貼板的io

? df = pd.read_clipboard()

? df.to_clipboard()

2、csv的io

?? df.to_csv('xxx.csv')

?? df = pd.read_csv('xxx.csv')

3、json的io

?? df.to_json()

?? pd.read_json(df.to_json())

4、excel的io

? ? df.to_excel('xx.xlsx')

? ? df = pd.read_excel('xx.xlsx')

5、df = pd.read_sql('')

? ? df.to_sql('')

1、iloc

? sub_df = df.iloc[10:20,:]? 選取DataFrame的10-20行,所有列數(shù)據(jù)

? sub_df = df.iloc[10:20,0:2]

? 說明:iloc函數(shù)是位置索引,與索引的名字無關(guān)。

2、loc

? sub_df = df.loc[10:20,:'movie_name']

? 說明:loc是標(biāo)簽索引,10,20,'movie_name'? 都是索引名字,與位置無關(guān)。

1、Series.reindex(index=['x1','x2','x3'],fill_value=10)

? 將df重新索引,并且將NaN空值用10進(jìn)行填充

2、Series.reindex(index=range(15),method='ffill')

前項(xiàng)填充,后面的值用前面的值進(jìn)行填充

通過reindex想到,如果想新增一個(gè)空列或者空行,可以用reindex方法,同樣地,想減少某些行或者某些列,也可以用reindex方法。

? 繼reindex之后刪除行列的函數(shù)操作

? Series.drop('A') ? #刪除'A'所對應(yīng)的值

? DataFrame.drop(label,axis)?

? label可以是行名也可以是列名,label是行的話axis是0,label是列的話axis是1。

** 刪除行還可以用 del df['A']

nan是numpy的一種數(shù)據(jù)類型,np.nan,float類型

任何數(shù)據(jù)與nan的運(yùn)算結(jié)果都是nan

1、nan in Series

? Series.isnull()? --返回value為True或者False的Series

? Series.notnull()? --返回value為True或者False的Series

? Series.dropna()? --返回刪除nan值后的Series

? Series.fillna(method='ffill')? --前項(xiàng)插值,按照前面的值填充后面的空值

2、nan in DataFrame

? df.isnull()? --返回value為True或者False的DataFrame

? df.notnull()? --返回value為True或者False的DataFrame

? df.dropna(axis=0/1,how='any/all',thresh=None)

? 說明:axis表示刪除行為nan或者列為nan;

? ? ? ? ? ? any表示只要有一個(gè)為空,all表示行中的每個(gè)元素或者列中的每個(gè)元素為空;

? ? ? ? ? ? thresh是閾值的意思,表示某行或者某列nan的個(gè)數(shù)達(dá)到閾值的個(gè)數(shù)時(shí)才刪除該行或該列。

? df.fillna(value=1)? ---所有的空值都填充為1

? df.fillna(value={0:0,1:1,2:2}) ---將0列的空值填為0,1列的空值填為1,2列的空值填為2,默認(rèn)為填充列

? 注意:fillna和dropna的特點(diǎn),生成新的DataFrame,原來的DataFrame不變。

1、多重索引介紹

Series = pd.Series(np.random.randn(6),index=[['1','1','1','2','2','2'],['a','b','c','a','b','c']])

'1','2'為一級索引,'a','b','c'為二級索引

df 可以看做是索引的'1','2'的Series

Series['1']? --Series

Series['1']['a']? --value

Series[:,'a'] --選擇'1'和'2'中的'a'對應(yīng)的值

2、多重索引格式轉(zhuǎn)為二維DataFrame

df = Series.unstack() --轉(zhuǎn)為二維DataFrame

3、多重索引在DataFrame中的操作

1、 map函數(shù)與apply函數(shù)、applymap函數(shù)的區(qū)別:

? 1)map函數(shù)對Series中的每個(gè)元素作用;

? 2)applymap函數(shù)對DataFrame中的每個(gè)元素作用;

? 3)apply函數(shù)對對DataFrame和Series的一列做整體運(yùn)算。

2、Series.replace(to_replace=[2,3,4],values=[20,30,40])? 替換Series中多個(gè)值

Series.replace({1:10,2:20})? 將索引為1的值替換為10,將索引為2的值替換為20

df.sum()? --默認(rèn)按照列進(jìn)行求和,nan的值被忽略

df.min()? --默認(rèn)按照列求最小值

df.max()? --默認(rèn)按照列求最大值

df.mean()? --默認(rèn)按照列求平均值

df.describe()? --默認(rèn)按照列進(jìn)行描述

df.sum(axis=1)? --按行求和,nan的值被忽略

#axis=0表示對橫軸進(jìn)行操作,但是運(yùn)算中表現(xiàn)為縱軸操作

#axis=1表示對縱軸進(jìn)行操作,但是運(yùn)算中表現(xiàn)為橫軸操作

bins = [0,59,70,80,100],bins是分割范圍

score_cat = pd.cut(Series,bins)? ---得到catgory類型的數(shù)據(jù)

DataFrame的分箱技術(shù)很棒??!

pd['catgory'] = pd.cut(df['a'],bins=[0,59,70,80,100],labels=['low','ok','good','great'])

--新增一列,將a列的值按照labels進(jìn)行分類標(biāo)記,good!!!

#生成長度為3的隨機(jī)字符串? pd.util.testing.rands(3)

1、按照一列分組

? g = df.groupby('city')

? g是分組類型數(shù)據(jù),打印不出來,所以看不到,但是有屬性和方法可以間接的了解

1) g.groups? --得到分的幾個(gè)組,和每個(gè)組包含的索引

2)g.get_group('BJ')? --得到'BJ'所對應(yīng)的組

3)groupby = split +apply +combine

? ? ?? g.mean()? --求每組的平均值

? ? ?? g.max() ? --求每組的最大值

? ? ?? g.min() ? --求每組的最小值

? ? ?? g.count()

? ? ?? g.describe()

? 4)g是一個(gè)可迭代對象,可以用list函數(shù)將其轉(zhuǎn)化為list

? ? ? list(g) -- [('組名1',DataFrame1),('組名2',DataFrame2),(),()]

? ? ? dict(list(g))? --將其轉(zhuǎn)化為字典

? 同時(shí)可以通過for循環(huán)進(jìn)行遍歷操作:for item,desc in g:print(item,desc)

? #怪不得分組后不是DataFrame,因?yàn)樵M的第一個(gè)元素是'分組名'。

2、按照多列分組

? g_new = df.groupby(['city','wind'])

? 得到生成器((('分組1','分組2'),DataFrame),(),()...)

? g_new.get_group(('分組1','分組2'))

? for (name_1,name_2),group in g_new:

? ? ? ? ? print((name_1,name_2),group)

g.mean()? --求每組的平均值

與g.agg('mean')方法一樣

pd.pivot_table(df,index=['',''],aggfuc='sum',values=['',''])

index是分組的組名,values是透視表呈現(xiàn)結(jié)果的列,columns是values下的分解

#感覺透視表呈現(xiàn)的結(jié)果就是groupby+agg后的結(jié)果

#分析者需要對數(shù)據(jù)結(jié)構(gòu)有一定的了解

df.sort_values(by='',ascending=True/False)[:10]? df可以索引

df.value_counts()? --按值計(jì)數(shù)

df.['a'] = df['b'].apply(lambda x:x0)? --DataFrame中的True/False

通過g.size()可以看到被groupby之后的數(shù)據(jù),得到的是一個(gè)Series

1、Series的排序:

1)對值進(jìn)行排序

Series.sort_values()? ---直接對Series的值進(jìn)行排序

2)通過索引進(jìn)行排序

Series.sort_index()?

#默認(rèn)都是升序排列

2、DataFrame的排序

df.sort_values(by='')? --按照某列的順序進(jìn)行排序

df['a'].sort_values()? --返回對a列數(shù)據(jù)的排序結(jié)果,只返回a列

1、df.index = Series(['a','b','c'])? 直接對index賦予新值

2、df.index = df.index.map(str.upper)

map函數(shù)中只傳入新的函數(shù)名即可

3、df.rename(index=str.upper,columns=str.lower)

? 或者傳遞字典,進(jìn)行一一轉(zhuǎn)換

pd.merge(df1,df2,on=None,how='left/right/inner/outer')

pd.merge(df1,df2)? --沒有on參數(shù)默認(rèn)先找相同的columns,然后在columns下找相同的values

pd.merge(df1,df2,on='columns')? --on參數(shù)是指按照指定列進(jìn)行merge

left:表示以左邊的數(shù)據(jù)表為基準(zhǔn),進(jìn)行填充右面的數(shù)據(jù)

right:表示以右邊的數(shù)據(jù)表為基準(zhǔn),填充左邊的數(shù)據(jù)

outer:以on的指定列的所有值為基準(zhǔn),填充兩邊的數(shù)據(jù)

inner:默認(rèn)inner,相同on指定的columns下的相同values對應(yīng)的左右兩邊的數(shù)據(jù)

1、concat拼接

pd.concat([Series1,Series2])

pd.concat([df1,df2])? -- 上下疊加,將沒有的列進(jìn)行填充

2、combine組合

Series1.combine_first(Series2)? --用Series2的值去填充Series1中為空的值

df1.combine_first(df2)? ---用df2將df1中的空值填充

df['A'] = df['A'].apply(str.upper)? ---apply函數(shù)中也只輸入函數(shù)名

len(df)? --求df的長度

len(df['a'].unique())? --查看a列中不重復(fù)數(shù)據(jù)的多少

Series.duplicated()? --返回一列True/False的Series

Series.drop_duplicates()? --刪除重復(fù)值

df.drop_duplicates('a',keep='first/last')

df.drop_duplicates()? --刪除完全重復(fù)的行

參數(shù):'a'表示以a列為基準(zhǔn),刪除重復(fù)值

? ? ? ? ? first表示保留第一個(gè),last表示保留最后一個(gè)

data_list = pd.date_range(start,end,period='D',freq)

period='D',以天為單位

freq = 'W' 以周為單位

freq = 'W-Mon'以每周一位單位

freq = '5H'? 以5h為單位

以data_range作為索引提取數(shù)據(jù)比較簡單

df[datetime(2017,9,1)]

df['2017-09-01']

df['20170901']

df['201709']

對時(shí)間序列數(shù)據(jù)進(jìn)行分組聚合操作:

s1.resample('M').mean()? --以月為單位進(jìn)行采樣,然后求每組的平均值

s1.resample('H').ffill()? --前項(xiàng)填充

s1.resample('H').bfill()? --后項(xiàng)填充

補(bǔ)充:1)jupyter中可以執(zhí)行l(wèi)inux命令,太棒了!

? ? ? ? ? ? !ls

? ? ? ? ? ? !more xxx.csv

? ? ? ? ? ? !pwd? 等等

? ? ?? 2)jupyter 查看函數(shù)幫助的快捷鍵:摁住shift + tab? 棒?。。?/p>

名稱欄目:python匯總函數(shù)名稱 python中函數(shù)大全
鏈接URL:http://muchs.cn/article30/docdppo.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站收錄、企業(yè)網(wǎng)站制作、云服務(wù)器、手機(jī)網(wǎng)站建設(shè)響應(yīng)式網(wǎng)站、網(wǎng)站營銷

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站建設(shè)