好用的Python庫(kù)有哪些

本篇內(nèi)容主要講解“好用的Python庫(kù)有哪些”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“好用的Python庫(kù)有哪些”吧!

創(chuàng)新互聯(lián)公司歡迎咨詢:18980820575,為您提供成都網(wǎng)站建設(shè)網(wǎng)頁(yè)設(shè)計(jì)及定制高端網(wǎng)站建設(shè)服務(wù),創(chuàng)新互聯(lián)公司網(wǎng)頁(yè)制作領(lǐng)域十多年,包括成都三維植被網(wǎng)等多個(gè)行業(yè)擁有豐富的營(yíng)銷推廣經(jīng)驗(yàn),選擇創(chuàng)新互聯(lián)公司,為企業(yè)錦上添花!

1. Wget

數(shù)據(jù)提取,尤其是從網(wǎng)絡(luò)中提取數(shù)據(jù),是數(shù)據(jù)科學(xué)家的重要任務(wù)之一。Wget是一個(gè)免費(fèi)的工具,用于從Web下載非交互式的文件,它支持HTTP、HTTPS和FTP協(xié)議,以及通過(guò)HTTP代理進(jìn)行檢索。由于它是非交互式的,所以即使用戶沒(méi)有登錄,它也可以在后臺(tái)工作。因此,她很適合用于下載一個(gè)網(wǎng)站或一個(gè)頁(yè)面的所有圖像。

(項(xiàng)目地址:https://pypi.org/project/wget/)

安裝:

$ pip install wget

示例:

import wget url = 'http://www.futurecrew.com/skaven/song_files/mp3/razorback.mp3' filename = wget.download(url) 100% [................................................] 3841532 / 3841532 filename 'razorback.mp3'

2. Pendulum

對(duì)于那些需要在Python項(xiàng)目中使用日期時(shí)間的人來(lái)說(shuō),Pendulum就是一項(xiàng)不錯(cuò)的項(xiàng)目選自。它是一個(gè)用于簡(jiǎn)化datetimes操作的Python包。它完全可以替代Python的原生類。

(項(xiàng)目地址:https://github.com/sdispater/pendulum)

安裝:

$ pip install pendulum

示例:

import pendulum dt_toronto = pendulum.datetime(2012, 1, 1, tz='America/Toronto') dt_vancouver = pendulum.datetime(2012, 1, 1, tz='America/Vancouver') print(dt_vancouver.diff(dt_toronto).in_hours()) 3

3. imbalanced-learn

事實(shí)上,當(dāng)每個(gè)類的樣本數(shù)量幾乎相同的情況下,分類算法的效果是最好的,但在實(shí)際項(xiàng)目中大部分的數(shù)據(jù)集是不平衡的,這些數(shù)據(jù)集對(duì)機(jī)器學(xué)習(xí)算法的學(xué)習(xí)階段和后續(xù)預(yù)測(cè)都有影響,imbalanced-learn的創(chuàng)建就是為了解決此類問(wèn)題,它與scikit-learn兼容,是scikit-learn-contrib項(xiàng)目的一部分。下次如果你遇到不平衡的數(shù)據(jù)集時(shí),考慮一下它。

(項(xiàng)目地址:https://github.com/scikit-learn-contrib/imbalanced-learn)

安裝:

pip install -U imbalanced-learn # or conda install -c conda-forge imbalanced-learn

4. FlashText

在NLP任務(wù)中清理文本數(shù)據(jù)通常需要替換句子中的關(guān)鍵字或從句子中提取關(guān)鍵字。這類操作一般使用正則表達(dá)式來(lái)完成,但是如果搜索的關(guān)鍵詞數(shù)量達(dá)到數(shù)千個(gè),就會(huì)變得很麻煩。Python的FlashText模塊是基于FlashText算法,它為這種情況提供了一個(gè)合適的替代方案。FlashText最好的部分是,不管搜索詞的數(shù)量是多少,運(yùn)行時(shí)都是一樣的。

(項(xiàng)目地址:https://github.com/vi3k6i5/flashtext)

安裝:

$ pip install flashtext

示例:

from flashtext import KeywordProcessor keyword_processor = KeywordProcessor() # keyword_processor.add_keyword(<unclean name>, <standardised name>) keyword_processor.add_keyword('Big Apple', 'New York') keyword_processor.add_keyword('Bay Area') keywords_found = keyword_processor.extract_keywords('I love Big Apple and Bay Area.') keywords_found ['New York', 'Bay Area']

關(guān)鍵詞替換:

keyword_processor.add_keyword('New Delhi', 'NCR region') new_sentence = keyword_processor.replace_keywords('I love Big Apple and new delhi.') new_sentence 'I love New York and NCR region.'

5. Fuzzywuzzy

這個(gè)名字聽(tīng)起來(lái)確實(shí)很奇怪,但是涉及到字符匹配時(shí),fuzzywuzzy是一個(gè)非常有用的庫(kù)??梢钥焖賹?shí)現(xiàn)諸如字符串匹配度、令牌匹配度等操作。它還可以方便地匹配保存在不同數(shù)據(jù)庫(kù)中的記錄。

(項(xiàng)目地址:https://github.com/seatgeek/fuzzywuzzy)

安裝:

$ pip install fuzzywuzzy

示例:

from fuzzywuzzy import fuzz from fuzzywuzzy import process # Simple Ratio fuzz.ratio("this is a test", "this is a test!") 97 # Partial Ratio fuzz.partial_ratio("this is a test", "this is a test!")  100

6. PyFlux

時(shí)間序列分析是機(jī)器學(xué)習(xí)領(lǐng)域最常遇到的問(wèn)題之一。PyFlux是為處理時(shí)間序列問(wèn)題而構(gòu)建的Python開(kāi)源庫(kù)。該庫(kù)擁有一系列優(yōu)秀的現(xiàn)代時(shí)間序列模型,包括但不限于ARIMA、GARCH和VAR模型??傊?,PyFlux為時(shí)間序列建模提供了一種高效的方法。值得嘗試。

(項(xiàng)目地址:https://github.com/RJT1990/pyflux)

安裝:

pip install pyflux

7. Ipyvolume

結(jié)果交流是數(shù)據(jù)科學(xué)的一個(gè)重要方面,可視化是一個(gè)很大的優(yōu)勢(shì),IPyvolume是一個(gè)Python庫(kù),用于在Jupyter筆記本中可視化三維圖形(如三維立體圖等),遺憾的是目前它還處于測(cè)試版本階段。

(項(xiàng)目地址:https://github.com/maartenbreddels/ipyvolume)

安裝:

Using pip $ pip install ipyvolume Conda/Anaconda $ conda install -c conda-forge ipyvolume

示例:

8. Dash

Dash是一個(gè)用于構(gòu)建Web應(yīng)用程序的高效Python框架。它是基于Flask、Plotly.js和React.js創(chuàng)建的,并結(jié)合了現(xiàn)代UI元素(如下拉框、滑塊和圖形)與用戶分析性Python代碼綁定在一起,而不需要再借助Javascript。Dash非常適合構(gòu)建數(shù)據(jù)可視化應(yīng)用。然后可以在Web瀏覽器中呈現(xiàn)這些應(yīng)用程序。

(項(xiàng)目地址:https://github.com/plotly/dash)

安裝:

pip install dash==0.29.0  # The core dash backend pip install dash-html-components==0.13.2  # HTML components pip install dash-core-components==0.36.0  # Supercharged components pip install dash-table==3.1.3  # Interactive DataTable component (new!)

示例:

好用的Python庫(kù)有哪些

9. Bashplotlib

Bashplotlib是一個(gè)Python包和命令行工具,用于在終端生成基本的繪圖,使用Python編寫(xiě)的,當(dāng)用戶無(wú)法訪問(wèn)GUI時(shí),可視化數(shù)據(jù)就變得很方便。

安裝:

pip install bashplotlib

示例:

scatter --file data/texas.txt --pch .

好用的Python庫(kù)有哪些

hist --file data/exp.txt

好用的Python庫(kù)有哪些

10. Colorama

colorama是一個(gè)Python專門用來(lái)在控制臺(tái)、命令行輸出彩色文字的模塊,可以跨平臺(tái)使用,在windows下linux下都工作良好。它使用標(biāo)準(zhǔn)的ANSI轉(zhuǎn)義碼來(lái)著色和樣式終端輸出。(項(xiàng)目地址:https://github.com/tartley/colorama)

安裝:

pip install colorama

示例:

import colorama from colorama import Fore, Back, Style colorama.init() # Set the color semi-permanently print(Fore.CYAN) print("The Text will appear in cyan until it is reset") print(Style.RESET_ALL) # Colorize a single line and then reset print(Fore.RED + 'Colorize a single line in RED' + Style.RESET_ALL) # Colorize a single word in the output print('You can also colorize a single word' + Back.GREEN + 'words' + Style.RESET_ALL + ' can be highlighted') # Combine foreground and background color print(Fore.BLUE + Back.WHITE) print('Foreground, background, and styles can be combined') print("==========            ") print(Style.RESET_ALL) print('Reset everything back to normal.')

輸出如下:

好用的Python庫(kù)有哪些

到此,相信大家對(duì)“好用的Python庫(kù)有哪些”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

新聞標(biāo)題:好用的Python庫(kù)有哪些
網(wǎng)頁(yè)路徑:http://www.muchs.cn/article40/ihejho.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、域名注冊(cè)網(wǎng)頁(yè)設(shè)計(jì)公司、App開(kāi)發(fā)、微信公眾號(hào)App設(shè)計(jì)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷型網(wǎng)站建設(shè)