10月17日,微軟在官網(wǎng)宣布,現(xiàn)在可以在Azure OpenAI公共預(yù)覽版中對GPT-3.5-Turbo、Babbage-002 和Davinci-002模型進(jìn)行數(shù)據(jù)微調(diào)。
使得開發(fā)人員通過自己的數(shù)據(jù)集,便能打造獨一無二的ChatGPT。例如,通過海量醫(yī)療數(shù)據(jù)進(jìn)行微調(diào),構(gòu)建專注醫(yī)療領(lǐng)域的ChatGPT助手,可詢問與醫(yī)療相關(guān)的病歷、專業(yè)術(shù)語、治療方案等內(nèi)容。
目前,全球各行業(yè)積累了幾年甚至幾十年的巨量優(yōu)質(zhì)數(shù)據(jù),如何高效利用、查詢這些數(shù)據(jù)成為一大難題。
通過自有數(shù)據(jù)微調(diào)打造的AI助手可有效解決這一痛點,同時提升內(nèi)容的準(zhǔn)確性、安全性,是組織實現(xiàn)降本增效的利器。
詳細(xì)微調(diào)教程:https://learn.microsoft.com/en-us/azure/ai-services/openai/tutorials/fine-tune?tabs=command-line
微軟Azure服務(wù):https://azure.microsoft.com/en-us/products/ai-services/openai-service/
什么是數(shù)據(jù)微調(diào)
大模型數(shù)據(jù)微調(diào)(Fine-tuning)是一種遷移學(xué)習(xí)方法,用于深度學(xué)習(xí)和機器學(xué)習(xí)。通常數(shù)據(jù)微調(diào)是基于一個預(yù)訓(xùn)練好的模型(例如,GPT-3.5-Turbo)作為基石,然后在特定的任務(wù)數(shù)據(jù)集(例如,法律、醫(yī)療、營銷)上進(jìn)行額外的訓(xùn)練,使模型能生成特定業(yè)務(wù)領(lǐng)域的內(nèi)容。
例如,你想訓(xùn)練一個模型來回答法律相關(guān)的問題,首先在大量的通用文本數(shù)據(jù)上進(jìn)行預(yù)訓(xùn)練,然后在醫(yī)學(xué)問答數(shù)據(jù)集上進(jìn)行微調(diào)。
簡單來說,微調(diào)功能就是讓ChatGPT,完全按照你的數(shù)據(jù)來生成內(nèi)容。
需要注意的是,即便你有高質(zhì)量的數(shù)據(jù)集,但選擇的微調(diào)模型性能很差,生成的內(nèi)容也不會很理想。
而微軟提供基于OpenAI的GPT-3.5-Turbo,是一個經(jīng)過全球數(shù)百萬開發(fā)者驗證的高性能成熟模型。
Azure OpenAI新功能
Babbage-002和Davinci-002是微軟最新推出的GPT-3基礎(chǔ)模型,可生成文本、代碼等,沒有接受過遵循指令的訓(xùn)練。但在微調(diào)、托管服務(wù)費用方面更便宜。
Babbage-002取代了已棄用的Ada和Babbage 模型, Davinci-002 則取代了Curie和 Davinci。
GPT-3.5-Turbo是OpenAI性能最成熟模型之一,支持多輪深度對話、創(chuàng)建微調(diào)數(shù)據(jù)集、訓(xùn)練和部署等一站式開發(fā)服務(wù)。
Azure OpenAI微調(diào)功能演示
上傳數(shù)據(jù):微軟在Azure OpenAI內(nèi)置了數(shù)據(jù)過濾功能,當(dāng)檢測到用戶上傳的數(shù)據(jù)集包含非法、歧視等有害信息時,會自動刪除這些內(nèi)容。以下是上傳數(shù)據(jù)集代碼示例。
預(yù)訓(xùn)練:使用指定模型、訓(xùn)練和驗證數(shù)據(jù),并設(shè)置相應(yīng)的參數(shù)。開發(fā)者可將Azure OpenAI Studio用于簡單的GUI,或者使用微軟的REST API或OpenAI Python SDK。
開始啟動微調(diào)功能。
完成微調(diào)后,將返回評估指標(biāo),例如,訓(xùn)練和驗證損失等參數(shù)。
目前,微軟提供數(shù)據(jù)微調(diào)托管服務(wù),用戶無需擔(dān)心任何算力資源問題,只需要選擇時間即可。
收費標(biāo)準(zhǔn):Babbage-002為34美元/小時;Davinci-002為68美元/小時;GPT-3.5-Turbo為102美元/小時。
3)Azure OpenAI 服務(wù)中的推理托管:當(dāng)用戶完成微調(diào)后,就可以使用模型生成專屬內(nèi)容了。
如果你沒有足夠的算力資源平臺來支撐模型的日常輸出,微軟同樣提供了托管服務(wù)。
收費標(biāo)準(zhǔn):Babbage-002托管每小時1.7美元,Davinci-002每小時1.7美元,GPT-35-Turbo,每小時7美元。
本文素材來源微軟官網(wǎng),如有侵權(quán)請聯(lián)系刪除
未經(jīng)允許不得轉(zhuǎn)載:RPA中國 | RPA全球生態(tài) | 數(shù)字化勞動力 | RPA新聞 | 推動中國RPA生態(tài)發(fā)展 | 流 > 微軟Azure OpenAI支持?jǐn)?shù)據(jù)微調(diào)啦!可打造專屬ChatGPT
熱門信息
閱讀 (14728)
1 2023第三屆中國RPA+AI開發(fā)者大賽圓滿收官&獲獎名單公示閱讀 (13753)
2 《Market Insight:中國RPA市場發(fā)展洞察(2022)》報告正式發(fā)布 | RPA中國閱讀 (13055)
3 「RPA中國杯 · 第五屆RPA極客挑戰(zhàn)賽」成功舉辦及獲獎名單公示閱讀 (12964)
4 與科技共贏,與產(chǎn)業(yè)共進(jìn),第四屆ISIG中國產(chǎn)業(yè)智能大會成功召開閱讀 (11567)
5 《2022年中國流程挖掘行業(yè)研究報告》正式發(fā)布 | RPA中國