甲骨文發(fā)布MySQL HeatWave ML
甲骨文宣布,Oracle MySQL HeatWave現(xiàn)支持?jǐn)?shù)據(jù)庫內(nèi)機(jī)器學(xué)習(xí)(ML),為之前的事務(wù)處理和分析功能錦上添花,這是唯一支持此功能的MySQL云數(shù)據(jù)庫服務(wù)。MySQL HeatWave ML全面自動執(zhí)行機(jī)器學(xué)習(xí)生命周期,并將所有經(jīng)過訓(xùn)練的模型存儲在MySQL數(shù)據(jù)庫中,因此無需將數(shù)據(jù)或模型移動到機(jī)器學(xué)習(xí)工具或服務(wù)中。消除提取、轉(zhuǎn)換和加載 (ETL) 流程可降低應(yīng)用程序的復(fù)雜性與成本,并提高數(shù)據(jù)和模型的安全性。HeatWave ML功能現(xiàn)已包含在所有37個(gè)Oracle云基礎(chǔ)設(shè)施(OCI)區(qū)域的MySQL HeatWave數(shù)據(jù)庫云服務(wù)中。
HeatWave ML可以全面自動化模型訓(xùn)練、推斷和解釋
到目前為止,為MySQL應(yīng)用程序添加機(jī)器學(xué)習(xí)功能對許多開發(fā)人員來說非常困難且耗時(shí)。首先,開發(fā)人員需要將數(shù)據(jù)從數(shù)據(jù)庫提取到另一個(gè)系統(tǒng),以創(chuàng)建和部署 機(jī)器學(xué)習(xí)模型。在將機(jī)器學(xué)習(xí)應(yīng)用于應(yīng)用程序數(shù)據(jù)方面,這種方法創(chuàng)建了多個(gè)孤島,并延遲數(shù)據(jù)移動。這還導(dǎo)致數(shù)據(jù)庫外的數(shù)據(jù)激增,使其更易受到安全威脅,并增加了開發(fā)人員在多個(gè)環(huán)境中進(jìn)行編程的復(fù)雜性。其次,現(xiàn)有的服務(wù)期待開發(fā)人員成為指導(dǎo)機(jī)器學(xué)習(xí)模型訓(xùn)練過程的專家;否則,模型是次優(yōu)的,并會降低預(yù)測的準(zhǔn)確性。最后,大多數(shù)現(xiàn)有的 機(jī)器學(xué)習(xí)解決方案沒有包括相應(yīng)功能來解釋開發(fā)人員構(gòu)建的模型為何會提供某種特定預(yù)測。
MySQL HeatWave ML通過在MySQL數(shù)據(jù)庫內(nèi)原生集成機(jī)器學(xué)習(xí)功能來解決這些問題,而無需將數(shù)據(jù)ETL到其他服務(wù)。HeatWave ML完全自動化訓(xùn)練過程,并為給定數(shù)據(jù)集和指定任務(wù)創(chuàng)建具有最佳算法、最佳特征和最佳超參數(shù)的模型。HeatWave ML生成的所有模型都可以提供模型和預(yù)測解釋。
沒有其他云數(shù)據(jù)庫供應(yīng)商可以直接在數(shù)據(jù)庫服務(wù)中提供此類高級的機(jī)器學(xué)習(xí)功能。甲骨文此次發(fā)布的機(jī)器學(xué)習(xí)基準(zhǔn)測試可在大量公開可用的機(jī)器學(xué)習(xí)分類和回歸數(shù)據(jù)集上執(zhí)行,例如Numerai、Nomao和Bank Marketing等。針對在更大的HeatWave集群上進(jìn)行培訓(xùn)時(shí),會增加相對于Redshift ML的性能優(yōu)勢。使用MySQL HeatWave可以非常高效且快速地完成耗時(shí)的訓(xùn)練過程,因此客戶現(xiàn)在可以更頻繁地重新訓(xùn)練模型并跟上數(shù)據(jù)的變化。這樣可以使模型保持最新并提高預(yù)測的準(zhǔn)確性。
甲骨文首席企業(yè)架構(gòu)師Edward Screven表示:“正如在單一數(shù)據(jù)庫中集成運(yùn)行分析和事務(wù)處理一樣,我們現(xiàn)將機(jī)器學(xué)習(xí)引入MySQL HeatWave。MySQL HeatWave是甲骨文發(fā)展最迅速的云服務(wù)之一。越來越多客戶從Amazon和其他云數(shù)據(jù)庫服務(wù)遷移到MySQL HeatWave,并顯著提高了性能和降低成本。如今,我們還發(fā)布一系列豐富了HeatWave功能的其他創(chuàng)新,以提高可用性并降低成本。我們?nèi)虑彝耆该鞯幕鶞?zhǔn)測試結(jié)果再次表明,Snowflake、AWS、Microsoft和Google的速度比MSQL HeatWave更慢且成本更高。”
相較于其他云數(shù)據(jù)庫服務(wù),HeatWave ML提供了以下功能:
完全自動化的模型訓(xùn)練:使用HeatWave ML創(chuàng)建模型的所有不同階段都是完全自動化的,無需開發(fā)人員干預(yù)。這樣可以實(shí)現(xiàn)更準(zhǔn)確、無需手動操作的模型優(yōu)化,并且始終完成培訓(xùn)過程。Amazon Redshift等其他云數(shù)據(jù)庫服務(wù)提供了集成外部服務(wù)的機(jī)器學(xué)習(xí)功能,意味著開發(fā)人員在ML培訓(xùn)過程中需要進(jìn)行大量的手動輸入。
模型和推斷解釋:模型的可解釋性有助于開發(fā)人員了解機(jī)器學(xué)習(xí)模型的行為。例如,如果銀行拒絕客戶貸款,則它需要能夠確定模型的哪些參數(shù)有被考慮在內(nèi),或者模型是否包含任何偏差。預(yù)測可解釋性是一組技術(shù),有助于回答機(jī)器學(xué)習(xí)模型為何做出如此特定預(yù)測的問題。如今,預(yù)測解釋變得越來越重要,因?yàn)楣颈仨毮軌蚪忉屍錂C(jī)器學(xué)習(xí)模型作出的決策。HeatWave ML將模型解釋和預(yù)測解釋相結(jié)合,作為模型訓(xùn)練過程的一部分。因此,HeatWave ML創(chuàng)建的所有模型都可以提供模型和推斷解釋,而無需在推斷解釋時(shí)提供訓(xùn)練數(shù)據(jù)。甲骨文增強(qiáng)了現(xiàn)有的解釋技術(shù),以提高性能、可解釋性和質(zhì)量。其他云數(shù)據(jù)庫服務(wù)并未針對其所有機(jī)器學(xué)習(xí)模型提供如此豐富的可解釋性。
超參數(shù)優(yōu)化:HeatWave ML為超參數(shù)優(yōu)化實(shí)現(xiàn)了基于漸變搜索的全新縮減算法。這樣可以并行執(zhí)行超參數(shù)搜索,而不影響模型的準(zhǔn)確性。超參數(shù)優(yōu)化是機(jī)器學(xué)習(xí)模型訓(xùn)練最耗時(shí)的階段,此獨(dú)特功能可以為HeatWave ML提供優(yōu)于其他云服務(wù)構(gòu)建機(jī)器學(xué)習(xí)模型的性能優(yōu)勢。
算法選擇:HeatWave ML使用代理模型的概念來確定最佳的ML算法,以進(jìn)行訓(xùn)練。代理模型是一種展示完整復(fù)雜模型屬性的簡單模型。使用簡單的代理模型可非常高效地完成算法選擇,而不會犧牲準(zhǔn)確性。其他用于構(gòu)建機(jī)器學(xué)習(xí)模型的數(shù)據(jù)庫服務(wù)皆未提供這種代理建模功能。
智能數(shù)據(jù)采樣:在模型訓(xùn)練期間,HeatWave ML對一小部分?jǐn)?shù)據(jù)進(jìn)行抽樣,以提高性能。這種抽樣的方式是在樣本數(shù)據(jù)集中捕獲所有代表性的數(shù)據(jù)點(diǎn)。其他用于構(gòu)建機(jī)器學(xué)習(xí)模型的云服務(wù)采用了效率較低的方法,即使用隨機(jī)數(shù)據(jù)采樣,在不考慮數(shù)據(jù)分布特征的情況下對一小部分?jǐn)?shù)據(jù)進(jìn)行采樣。
特征選擇:這個(gè)功能有助于確定訓(xùn)練數(shù)據(jù)的屬性;這些屬性會影響機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)測的行為。HeatWave ML中的特征選擇技術(shù)針對多個(gè)域和應(yīng)用程序的大量數(shù)據(jù)集進(jìn)行了訓(xùn)練。根據(jù)這些收集到的統(tǒng)計(jì)信息和元數(shù)據(jù)信息,HeatWave ML能夠有效地識別新數(shù)據(jù)集中的相關(guān)特征。
除了機(jī)器學(xué)習(xí)功能,甲骨文還為MySQL HeatWave服務(wù)發(fā)布了更多創(chuàng)新。實(shí)時(shí)彈性功能讓客戶將HeatWave集群擴(kuò)展和縮小到任意數(shù)量的節(jié)點(diǎn),無需任何停機(jī)時(shí)間或只讀時(shí)間,也無需手動重新平衡集群。其他功能還包括數(shù)據(jù)壓縮,可讓客戶處理每個(gè)節(jié)點(diǎn)兩倍的數(shù)據(jù),并降低近50%的成本,同時(shí)保持相同的性價(jià)比。新增的暫停與恢復(fù)功能則可讓客戶暫停HeatWave,以節(jié)省成本?;謴?fù)后,MySQL Autopilot所需的數(shù)據(jù)和統(tǒng)計(jì)信息將自動重新加載到HeatWave中。
聯(lián)想(Lenovo)SR588服務(wù)器主機(jī)2U機(jī)架式 桌面云數(shù)據(jù)庫虛擬化 深度學(xué)習(xí)備份存儲 定制 2顆銀牌4210R 20核 2.2G丨雙電 64GB丨480GB+3*4TB Raid5
進(jìn)入購買
浪潮(INSPUR) NF5270M5機(jī)架式服務(wù)器(1顆3204 6核 1.9GHz/16G/2T*1 SATA/雙千兆*1/單電550W/三年服務(wù))
進(jìn)入購買
戴爾(DELL)R740服務(wù)器主機(jī)/2*至強(qiáng)銀牌4210R十核2.4GHz/16G*4/4TSAS*3/H730P-2G/750W雙電/導(dǎo)軌/三年保修
進(jìn)入購買
關(guān)鍵詞: MySQL
相關(guān)新聞