本篇內(nèi)容主要講解“怎么用Pandas制作pdf報告”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么用Pandas制作pdf報告”吧!
創(chuàng)新互聯(lián)公司專業(yè)為企業(yè)提供昌寧網(wǎng)站建設、昌寧做網(wǎng)站、昌寧網(wǎng)站設計、昌寧網(wǎng)站制作等企業(yè)網(wǎng)站建設、網(wǎng)頁設計與制作、昌寧企業(yè)網(wǎng)站模板建站服務,10多年昌寧做網(wǎng)站經(jīng)驗,不只是建網(wǎng)站,更提供有價值的思路和整體網(wǎng)絡服務。Pandas非常善于處理大規(guī)模數(shù)據(jù),支持將結果導出到CSV,Excel,HTML,json等文件中。 如果您想將 多種信息(excel、圖片等)組合 到一個文檔中,那么事情變得更加困難。今天我們介紹如何將excel更好看的輸出到pdf中,然后使用Jinja模板和WeasyPrint 再將其轉換為獨立的PDF文檔。
操作流程
使用Pandas將數(shù)據(jù)輸出到Excel文件中的多個工作表或者用DataFrames創(chuàng)建多個Excel文件非常方便。 但是,如果您想將 多種信息(excel、圖片等)組合 輸出到一個文件中,那么直接從Pandas進行操作的方法并不多。 幸運的是,萬能的python有很多選項可以幫助我們。
在本文中,我將采用以下流程來創(chuàng)建多頁PDF文檔。
工具
我決定使用HTML作為模板語言,因為它可能是生成結構化數(shù)據(jù)最便捷的方法,支持各種格式數(shù)據(jù)(如圖片、excel表)。我也認為每個人都知道(或可以弄清楚)足夠的HTML知識來生成一個簡單的報告。
這個工作流程中最困難的部分是弄清楚如何將HTML呈現(xiàn)為PDF。我覺得還沒有最佳的解決方案,但我選擇了 WeasyPrint ,因為它仍然在積極維護,我發(fā)現(xiàn)我可以相對容易地使它工作。作為替代方案,我過去使用過xhtml2pdf,它的效果也很好,遺憾的是該庫缺乏文檔說明,但它已存在一段時間,并且確實可以從HTML生成PDF。
數(shù)據(jù)
如上所述,我們將使用之前文章中的相同數(shù)據(jù)集。 為了使這一切成為一個獨立的文章,下面是我如何導入數(shù)據(jù),做描述性統(tǒng)計,及并生成關于CPU和軟件銷售的 數(shù)據(jù)透1視表 。
導入模塊,并讀入銷售渠道信息。
對數(shù)據(jù)做透1視表
sales_report = pd.pivot_table(df, index=["Manager", "Rep", "Product"], values=["Price", "Quantity"], aggfunc=[np.sum, np.mean], fill_value=0) sales_report.head()
模板
DataFrame擁有to_html()的方法,可以將dataframe數(shù)據(jù)轉化為含有HTML格式的字符串。
但是隨著您的報告變得越來越復雜或您選擇將Jinja模板用于您的網(wǎng)絡應用,jinja的這些功能將為您提供良好的服務。Jinja的另一個不錯的功能是它包含多個內(nèi)置過濾器,這些過濾器允許我們以Pandas中難以做到的方式格式化我們的一些數(shù)據(jù)。
為了在我們的應用程序中使用Jinja,我們需要做三件事:
創(chuàng)建一個模板
將變量添加到模板上下文中
將模板渲染為HTML
這是一個非常簡單的模板,我們稱之為myreport.html:
<!DOCTYPE html><html><head lang="en"> <meta charset="UTF-8"> <title>{{ title }} </title></head><body> <h3>Sales Funnel Report - National</h3> {{ national_pivot_table }}</body></html>
上面html代碼中擁有 {{title}} 和 {{national_pivot_table }} 這兩個關鍵詞。這兩個關鍵詞用來接收需要渲染的數(shù)據(jù),比如圖片對象、dataframe對象等。
要填充這些變量,我們需要創(chuàng)建一個Jinja環(huán)境并獲取我們的模板對象:
from jinja2 import Environment, FileSystemLoader env = Environment(loader=FileSystemLoader('.')) template = env.get_template('myreport.html')
在上面的示例中,我假設模板位于當前目錄中,但您可以將完整路徑放到模板位置。
另一個關鍵組件是 env 的創(chuàng)建。 這個變量是我們將數(shù)據(jù)(或?qū)ο螅┨畛浣o模板的方式。 我們創(chuàng)建了一個名為 template_var 的字典,其中包含我們想要傳遞給模板的所有變量。
請注意變量的名稱如何與我們的模板匹配。即名稱要與myreport.html中的{{}}夾住的關鍵詞一樣。
template_vars = {"title" : "Sales Funnel Report - National", "national_pivot_table": sales_report.to_html()}
最后一步是將 template_vars 渲染到html模板中,并輸出為html字符串,最終我們將使用該html字符串來生成pdf報告。
html_out = template.render(template_vars)
為簡潔起見,我不會顯示完整的HTML,但您應該明白這一點。
生成pdf
pdf報告的生成部分相當簡單,這里用到weasyprint庫
from weasyprint import HTML HTML(string=html_out).write_pdf("report.pdf")
但是打開的pdf樣式很簡單,白底黑字并不美觀。之所以這樣是因為我們沒有使用自定義樣式表css,但是咱們不熟悉css,有一種簡單的辦法就是用成熟的css,這里我用的typography.css 作為填充表格時的樣式表。這個css的優(yōu)點有:
相對較小且易于理解
可以在PDF引擎中運行而不會拋出錯誤和警告
能讓表格表格看起來很美觀
讓我們嘗試使用我們更新的樣式表重新渲染它:
HTML(string=html_out).write_pdf('beautiful_report.pdf', stylesheets=["typography.css"])
到此,相信大家對“怎么用Pandas制作pdf報告”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關內(nèi)容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!
當前名稱:怎么用Pandas制作pdf報告-創(chuàng)新互聯(lián)
文章位置:http://muchs.cn/article48/dshchp.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供ChatGPT、面包屑導航、手機網(wǎng)站建設、網(wǎng)站收錄、App開發(fā)、App設計
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)