Pandas中apply函數(shù)怎么用

這篇文章主要介紹Pandas中apply函數(shù)怎么用,文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!

站在用戶的角度思考問題,與客戶深入溝通,找到白城網(wǎng)站設(shè)計與白城網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗,讓設(shè)計與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個性化、用戶體驗好的作品,建站類型包括:成都網(wǎng)站設(shè)計、網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、申請域名網(wǎng)站空間、企業(yè)郵箱。業(yè)務(wù)覆蓋白城地區(qū)。

使用apply拆分文本

Pandas 中 apply 函數(shù),應(yīng)用廣泛,今天要跟大家分享一個使用的技巧,使用 apply 將 dataframe 中內(nèi)容為 list 的列拆分為多列。

拆分前的數(shù)據(jù)情況,如下圖紅色標(biāo)注所示:

Pandas中apply函數(shù)怎么用

拆分后,如下圖所示:

Pandas中apply函數(shù)怎么用

這個案例中,Lemon 使用的數(shù)據(jù)來自 akshare ,在開始前,引入相關(guān) package :

# -*- coding: utf-8 -*-  """  @Author: Lemon  @出品:Python數(shù)據(jù)之道  @Homepage: liyangbit.com  """  import numpy as np  import pandas as pd  import akshare as ak

Lemon 使用的幾個 Python 庫的版本信息如下:

print('numpy版本:{}'.format(np.__version__))  print('pandas版本:{}'.format(pd.__version__))  print('akshare版本:{}'.format(ak.__version__)) # numpy版本:1.18.1  # pandas版本:1.0.3  # akshare版本:0.7.53

如果代碼運(yùn)行出現(xiàn)問題,請先檢查下這幾個Python庫的版本是否與上面的一致

先從 akshare 獲取需要的數(shù)據(jù),分為兩步,第一步是獲取基金代碼的列表,如下:

df = ak.fund_em_fund_name().head(20).tail(5)  dfdf = df[['基金代碼','基金簡稱']]  print(df)

第二步是獲取基金凈值數(shù)據(jù)和凈值日期,通過一個自定義函數(shù)來獲取,自定義函數(shù)如下:

# 自定義函數(shù)只有一個參數(shù)的情形  # 獲取基金單位凈值以及凈值日期  def get_mutual_fund(code):      df = ak.fund_em_open_fund_info(fund=code, indicator="單位凈值走勢")      dfdf = df[['凈值日期', '單位凈值','日增長率']]      # df.columns = ['凈值日期', '單位凈值', 'equityReturn', 'unitMoney']      df['凈值日期'] = pd.to_datetime(df['凈值日期'])      dfdf = df.sort_values('凈值日期',ascending=False)      unit_equity = df.head(1)['單位凈值'].values[0]      date_latest = df.head(1)['凈值日期'].values[0]      return [unit_equity, date_latest]

對于這個自定義函數(shù),在 pandas 使用 apply 來應(yīng)用自定義函數(shù),這是使用 apply 的一種常用的方法,如下:

# 獲取基金最新的單位凈值和凈值日期  df['tmp'] = df['基金代碼'].apply(get_mutual_fund)  print(df)

獲取的數(shù)據(jù)截圖如下:

Pandas中apply函數(shù)怎么用

文本拆分

上圖中的 tmp 列,就是我們這次需要進(jìn)行處理的對象。

處理方法可以有多種,這里 Lemon 使用 pandas 中的 apply 來處理,相對來說,也是比較便捷的方式。

在 apply 函數(shù)中,使用 pd.Series 就可以達(dá)到我們的目的。

# 將單位凈值和凈值日期單獨(dú)成列  df[['最新單位凈值','凈值日期']] = df['tmp'].apply(pd.Series)  dfdf = df.drop('tmp',axis=1)  print(df)

結(jié)果如下:

Pandas中apply函數(shù)怎么用

以上是“Pandas中apply函數(shù)怎么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!

文章題目:Pandas中apply函數(shù)怎么用
標(biāo)題來源:http://muchs.cn/article0/gppjio.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)網(wǎng)站制作網(wǎng)站改版、移動網(wǎng)站建設(shè)網(wǎng)站內(nèi)鏈、微信小程序、品牌網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站建設(shè)