5種云計(jì)算所需的機(jī)器學(xué)習(xí)技能

2022-10-03    分類: 網(wǎng)站建設(shè)

機(jī)器學(xué)習(xí)和人工智能將會(huì)繼續(xù)深入IT服務(wù)領(lǐng)域,并為軟件工程師開(kāi)發(fā)的應(yīng)用程序提供補(bǔ)充。如果IT團(tuán)隊(duì)想跟上發(fā)展步伐,就需要提高他們的機(jī)器學(xué)習(xí)技能。

云計(jì)算服務(wù)為構(gòu)建和部署人工智能和機(jī)器學(xué)習(xí)應(yīng)用程序所需的一系列功能提供支持。在許多方面,人工智能系統(tǒng)的管理方式與IT專業(yè)人士在云平臺(tái)中熟悉的其他軟件非常相似。但只是因?yàn)榭梢圆渴饝?yīng)用程序,并不意味著可以成功地部署機(jī)器學(xué)習(xí)模型。

5種云計(jì)算所需的機(jī)器學(xué)習(xí)技能

雖然這些共同點(diǎn)可能會(huì)促進(jìn)過(guò)渡,但也存在著顯著的差異。除了軟件工程技能之外,組織的IT團(tuán)隊(duì)成員還需要擁有特定的機(jī)器學(xué)習(xí)和人工智能知識(shí)。除了技術(shù)專長(zhǎng)之外,他們還需要了解目前可用的云計(jì)算工具來(lái)支持他們團(tuán)隊(duì)的計(jì)劃。

IT專業(yè)人士需要探索在云端成功使用人工智能所需的五種機(jī)器學(xué)習(xí)技能,并了解亞馬遜、微軟和谷歌提供支持這些技能的產(chǎn)品。雖然這些技能有一些重疊,但不會(huì)有全能的技能。通過(guò)培養(yǎng)具有這些技能的團(tuán)隊(duì)成員,可以讓組織獲得利用基于云計(jì)算的機(jī)器學(xué)習(xí)的優(yōu)勢(shì)。

1. 數(shù)據(jù)工程

如果IT專業(yè)人員想在云平臺(tái)實(shí)施任何類型的人工智能策略,都需要了解數(shù)據(jù)工程。數(shù)據(jù)工程包含一系列要求數(shù)據(jù)整理和工作流開(kāi)發(fā)的技能,以及一些軟件架構(gòu)的知識(shí)。

IT專業(yè)知識(shí)的不同領(lǐng)域可以分解為IT專業(yè)人員應(yīng)該完成的不同任務(wù)。例如,數(shù)據(jù)整理通常涉及數(shù)據(jù)源標(biāo)識(shí)、數(shù)據(jù)提取、數(shù)據(jù)質(zhì)量評(píng)估、數(shù)據(jù)集成和管道開(kāi)發(fā),以在生產(chǎn)環(huán)境中執(zhí)行這些操作。

數(shù)據(jù)工程師應(yīng)該能夠輕松地使用關(guān)系數(shù)據(jù)庫(kù)、NoSQL數(shù)據(jù)庫(kù)和對(duì)象存儲(chǔ)系統(tǒng)。Python是一種流行的編程語(yǔ)言,可以與批處理和流處理平臺(tái)(如apachebeam)和分布式計(jì)算平臺(tái)(如apachespark)一起使用。即使IT人員不是精通Python程序的專家,掌握一些Python語(yǔ)言的知識(shí)將使其能夠從大量的開(kāi)源工具中獲取數(shù)據(jù)工程和機(jī)器學(xué)習(xí)。

數(shù)據(jù)工程在所有主要云平臺(tái)中都得到了很好的支持。AWS公司提供了全面的服務(wù)來(lái)支持?jǐn)?shù)據(jù)工程,例如AWS Glue,適用于Apache Kafka的Amazon Managed Streaming(MSK)和各種Amazon Kinesis服務(wù)。AWS Glue是數(shù)據(jù)目錄以及提取、轉(zhuǎn)換和加載(ETL)服務(wù),其中包括對(duì)計(jì)劃作業(yè)的支持。MSK是數(shù)據(jù)工程管道的有用構(gòu)建塊,而Kinesis服務(wù)對(duì)于部署可擴(kuò)展流處理管道特別有用。

谷歌云平臺(tái)提供了Cloud Dataflow,這是一項(xiàng)托管的Apache Beam服務(wù),可以支持批處理和Steam處理。對(duì)于ETL流程,谷歌云平臺(tái)提供了基于Hadoop的數(shù)據(jù)集成服務(wù)。

Microsoft Azure也提供了幾種托管數(shù)據(jù)工具,例如Azure Cosmos DB、Data Catalog和Data Lake Analytics等。

2. 建立模型

機(jī)器學(xué)習(xí)是一門(mén)正在不斷發(fā)展和進(jìn)步的學(xué)科,IT人員可以通過(guò)研究和開(kāi)發(fā)機(jī)器學(xué)習(xí)算法來(lái)從事自己的職業(yè)。

IT團(tuán)隊(duì)使用工程師提供的數(shù)據(jù)來(lái)構(gòu)建模型和創(chuàng)建可以提出建議,預(yù)測(cè)值和對(duì)項(xiàng)目進(jìn)行分類的軟件。重要的是要了解機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí),即使許多模型構(gòu)建過(guò)程都是在云中自動(dòng)完成的。

作為模型構(gòu)建者,需要了解數(shù)據(jù)和業(yè)務(wù)目標(biāo),制定問(wèn)題的解決方案,并了解如何將其與現(xiàn)有系統(tǒng)集成的工作。

市場(chǎng)上的一些產(chǎn)品包括谷歌公司的Cloud AutoML,這是可以幫助組織使用結(jié)構(gòu)化數(shù)據(jù)以及圖像、視頻和自然語(yǔ)言來(lái)構(gòu)建自定義模型的服務(wù),而無(wú)需對(duì)機(jī)器學(xué)習(xí)有更多的了解。 微軟Azure在Visual Studio中提供了ML.NET模型構(gòu)建器,該模型構(gòu)建器提供了用于構(gòu)建、訓(xùn)練和部署模型的界面。Amazon SageMaker是另一項(xiàng)托管服務(wù),用于在云中構(gòu)建和部署機(jī)器學(xué)習(xí)模型。

這些工具可以選擇算法,確定數(shù)據(jù)中哪些特征或?qū)傩宰钣杏?,并使用稱之為超參數(shù)調(diào)整的過(guò)程優(yōu)化模型。這些服務(wù)擴(kuò)展了機(jī)器學(xué)習(xí)和人工智能策略的潛在用途。正如人們駕駛汽車不必成為汽車機(jī)械工程師一樣,IT專業(yè)人員也不需要獲得機(jī)器學(xué)習(xí)的研究生學(xué)位來(lái)構(gòu)建有效的模型。

3. 公平與偏差檢測(cè)

算法做出的決策直接而顯著地影響個(gè)人。例如,金融服務(wù)使用人工智能來(lái)做出有關(guān)信貸的決策,這可能會(huì)無(wú)意中對(duì)特定人群產(chǎn)生偏見(jiàn)。這不僅可能有拒絕信貸對(duì)個(gè)人帶來(lái)的影響,而且還會(huì)使金融機(jī)構(gòu)面臨違反《平等信貸機(jī)會(huì)法》等法規(guī)的風(fēng)險(xiǎn)。

這些看似艱巨的任務(wù)對(duì)于人工智能和機(jī)器學(xué)習(xí)模型是必不可少的。檢測(cè)模型中的偏差可能需要具有統(tǒng)計(jì)和機(jī)器學(xué)習(xí)技能,但是與模型構(gòu)建一樣,某些繁重的工作可以由機(jī)器完成。

FairML是用于審核預(yù)測(cè)模型的開(kāi)源工具,可幫助開(kāi)發(fā)人員識(shí)別工作中的偏見(jiàn)。檢測(cè)模型偏差的經(jīng)驗(yàn)還可以為數(shù)據(jù)工程和模型構(gòu)建過(guò)程提供幫助。谷歌云的公平性工具在市場(chǎng)上,其中包括假設(shè)分析工具、公平性指標(biāo)和可解釋的人工智能服務(wù)。

4. 模型性能評(píng)估

模型構(gòu)建過(guò)程的一部分是評(píng)估機(jī)器學(xué)習(xí)模型的性能。例如,根據(jù)準(zhǔn)確性和召回率對(duì)分類器進(jìn)行評(píng)估?;貧w模型(例如那些預(yù)測(cè)房屋出售價(jià)格的模型)是通過(guò)測(cè)量平均誤差率來(lái)評(píng)估的。

如今表現(xiàn)良好的模型將來(lái)可能會(huì)表現(xiàn)不佳。問(wèn)題不在于該模型是否以某種方式被破壞,而是該模型是根據(jù)不再反映其使用環(huán)境的數(shù)據(jù)進(jìn)行訓(xùn)練的。即使沒(méi)有突然的重大事件,也會(huì)發(fā)生數(shù)據(jù)漂移。重要的是評(píng)估模型并在生產(chǎn)中繼續(xù)對(duì)其進(jìn)行監(jiān)視。

Amazon SageMaker、Azure Machine Learning Studio和Google Cloud AutoML等服務(wù)包括一系列模型性能評(píng)估工具。

5. 領(lǐng)域知識(shí)

領(lǐng)域知識(shí)并不是一種特定的機(jī)器學(xué)習(xí)技能,但它是成功的機(jī)器學(xué)習(xí)策略中最重要的部分之一。

每個(gè)行業(yè)都有一定的知識(shí)體系,必須以某種能力進(jìn)行研究,尤其對(duì)于構(gòu)建算法的決策者。機(jī)器學(xué)習(xí)模型受到約束以反映用于訓(xùn)練它們的數(shù)據(jù)。具有領(lǐng)域知識(shí)的IT人員對(duì)于知道在哪里應(yīng)用人工智能,并評(píng)估其有效性至關(guān)重要。

當(dāng)前題目:5種云計(jì)算所需的機(jī)器學(xué)習(xí)技能
本文路徑:http://muchs.cn/news/200813.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、微信公眾號(hào)、網(wǎng)站維護(hù)、ChatGPT、靜態(tài)網(wǎng)站虛擬主機(jī)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運(yùn)營(yíng)