獨角獸一起教育科技解碼——「AI+教育」在K12領(lǐng)域如何落地?
【大咖Live】AI自適應(yīng)教育專場第二期,獨角獸一起教育科技CTO楊康帶來了關(guān)于“解碼「AI+教育」在K12領(lǐng)域的落地與實踐”的主題分享,詳解一起教育科技在AI+教育方面的實踐經(jīng)驗。目前,本期分享音頻及全文實錄已上線,旗下會員組織「AI投研邦」會員可進(jìn)入【AI投研邦】頁面免費查看。
本文對整場分享進(jìn)行了要點總結(jié)及PPT整理,以幫助大家提前清晰地了解本場分享重點。
1、教育當(dāng)前現(xiàn)狀及面臨的困境是什么?
2、AI+教育可以解決什么?
3、傳統(tǒng)教育教學(xué)如何與當(dāng)前的AI技術(shù)結(jié)合?
4、場景化的AI+教育是怎樣的?
以下為一起教育科技CTO楊康的部分分享內(nèi)容,【AI投研邦】在不改變原意的基礎(chǔ)上做了整理和精編:
大家好,我是一起教育科技CTO楊康,今天分享的話題是“AI+教育”在K12領(lǐng)域的落地與實踐。
一起教育科技將所有用產(chǎn)品、技術(shù)手段幫助老師學(xué)生更好的完成教學(xué)和科研的過程定義為AI助教工作,包括課下多學(xué)科作業(yè)批改、課堂輔助教學(xué)、課前教學(xué)設(shè)備以及AI+老師的研發(fā)工作等。
上述探索和應(yīng)用的目的在于,一方面更好解放老師工作,將重復(fù)的機(jī)器擅長的工作交給機(jī)器,讓老師更好地進(jìn)行教學(xué)工作;同時,一起教育科技希望學(xué)生能夠更多地完成自主學(xué)習(xí),希望通過大數(shù)據(jù)和AI,讓學(xué)生更有針對性地進(jìn)行學(xué)習(xí)。
在教育領(lǐng)域,一起教育科技的落地實踐主要包含以下方面:語音識別&評測、圖像識別&批改、自然語言處理&語義理解屬于感知和語義層面技術(shù),自適應(yīng)學(xué)習(xí)、AI診斷、智能測評更貼近教育場景和數(shù)據(jù)。
一起教育科技通過語音識別解決英語口語打分的自動評測問題,通過圖像識別技術(shù)解決各個學(xué)科學(xué)生練習(xí)冊的自動批改;通過自然語言技術(shù)解決作文批改問題;通過自適應(yīng)學(xué)習(xí)技術(shù),解決學(xué)生個性化練習(xí)需求;同時,將大數(shù)據(jù)和AI結(jié)合,解決學(xué)生做錯題后的錯因分析和診斷問題;以及目前正在進(jìn)行的與學(xué)科能力測評相關(guān)的智能評測技術(shù)。
語音評測
楊康提到,語音評測在教育領(lǐng)域的應(yīng)用包括兩點:
一是進(jìn)行口語朗讀的語音評測??谡Z朗讀即學(xué)生根據(jù)一段文本英語內(nèi)容進(jìn)行跟讀,在發(fā)音過程中,音頻將通過設(shè)備端傳送至后臺服務(wù)器,一起教育科技后臺進(jìn)行相應(yīng)的口語打分,該過程主要評估學(xué)生語音的完整度、流利度。同時,在流利度本身中也會遇到一些細(xì)節(jié)性問題,比如流利英語發(fā)音(即考察韻律、重音、語速等細(xì)節(jié))。
二是半開放口語。半開放口語相對跟讀英語口語評測,前者多出的是語義的相似度判斷和語義匹配過程。半開放口語面對的問題是,給出一段文本和相應(yīng)的問題,學(xué)生需根據(jù)文本的理解對問題進(jìn)行語音回答。在語音回答過程中,用戶答案并不唯一,后臺并不能完全按照發(fā)音角度評估用戶打分,還需參考用戶回答問題的內(nèi)容本身是否有錯、內(nèi)容本身是否完整、是否回答題干相應(yīng)的關(guān)鍵詞或答案等等。 我們稱之為半開放口語的評測技術(shù)。事實上,這是語音打分技術(shù)+自然語言處理技術(shù)合成的綜合性技術(shù)解決方案。
語音評測算法同語音識別過程不同,因其面對問題更加確定,所以一起教育科技將相應(yīng)的準(zhǔn)確答案做成狀態(tài)機(jī),并稱之為FST。該狀態(tài)機(jī)中可能包含了相應(yīng)回答的文本。在完成聲學(xué)模型后,一起教育科技將狀態(tài)機(jī)同聲學(xué)模型結(jié)合,進(jìn)行解碼,完成匹配,并在匹配搜索的過程中進(jìn)行打分。
在一起教育科技看來,如果整體分差是零,或者整體分差是0-1,則效果相對較好。
上圖可以看到各家的引擎,一起教育科技與其他第三方引擎進(jìn)行評測。在小學(xué)英語的口語場景中,一起教育科技引擎效果良好。大部分的深紅色柱子逼近零區(qū)間。
如何進(jìn)行相應(yīng)的半開放口語評測?一起教育科技分為三個環(huán)節(jié):
語義分割:一起教育科技將一句話或一個段落劃分成不同的短語,短語中包含一些關(guān)鍵信息,利用短語和答案進(jìn)行匹配,即短語和短語之間的匹配。
同時,因為在所有中小學(xué)教學(xué)過程中,人名或代詞使用較多。所以在此類型問題中,一起教育科技利用指代消歧技術(shù)將一些單詞(例如my 、this)與原文中的名詞或人名、物體名進(jìn)行對應(yīng),此處應(yīng)用了指代消歧與實體關(guān)系修正的技術(shù)。
除指代消歧以外,一起教育科技進(jìn)行語義相似度的判斷。針對一句話,用戶的描述可能不同:比如doing sports和doing exercise 是一個意思。同義詞的判斷和語音相似度判斷可以用傳統(tǒng)的自然語言處理技術(shù)來實現(xiàn)。楊康表示,如果有更多樣本,可以使用深度學(xué)習(xí)的方法來進(jìn)行。
整體來看,語音技術(shù)在目前K12領(lǐng)域偏向于監(jiān)督式學(xué)習(xí)場景,如果有大量的用戶語料在小學(xué)、中學(xué)里面(包括發(fā)音、跟讀、開放口語等回答)。這些語料進(jìn)行標(biāo)注訓(xùn)練,可很好的提升本身語音技術(shù)的識別效果。
圖像識別
圖像識別技術(shù)在教育領(lǐng)域的應(yīng)用較廣,主要是感知層面上的智能應(yīng)用。如何識別相對復(fù)雜的數(shù)學(xué)符號,一起教育科技提出了一個基于 Attention 的識別模型。Attention在2017比較火,實際上Attention在圖像處理于在2014/2015年已有應(yīng)用。
為什么選用 Attention 作為拍照、批改場景的識別?因為CRNN技術(shù)更偏向于對行進(jìn)行掃描識別。
一起教育科技通過不同行即空間輸入,對整體進(jìn)行計算,同時用LSTM將序列模型能力發(fā)揮出來。一起教育是基于O2O批改的算法架構(gòu),O2O的意思是將紙質(zhì)教輔、練習(xí)冊數(shù)字化還原至線上,這是一起教育定義的O2O。
基于O2O批改算法架構(gòu)中,底層是大量數(shù)據(jù)標(biāo)注,包括好的標(biāo)注平臺、好的標(biāo)注團(tuán)隊(或外包、或公司團(tuán)隊),好的數(shù)據(jù)管理。因為針對性的標(biāo)注和訓(xùn)練和線上的使用反饋貫穿,線上效果不好的之處,我們通過邊角案例的挖掘,通過數(shù)據(jù)管理把它拎出來,讓標(biāo)注團(tuán)隊相應(yīng)的進(jìn)行標(biāo)注,從而進(jìn)行相應(yīng)的訓(xùn)練,重新訓(xùn)練效果即可得到提升。
上一層是圖像識別基礎(chǔ)模型和已上線效果,包括手寫識別、印刷體識別、公式識別、圖形檢測、圖形軌跡識別。再向上,一起教育科技做的是教輔批改和練習(xí)冊批改,除圖像識別能還原文字外,還需要考慮如何更好地批改。批改的過程是將文本轉(zhuǎn)化成數(shù)學(xué)的模型。
Socrates 智能學(xué)習(xí)系統(tǒng)
智能教學(xué)系統(tǒng)由一起教育科技自研,解決以下問題:孩子做錯題后,能夠通過一系列的自主完成的手段做對這道題。同時,孩子不是因為看到某答案或者只是通過這道題記住答案而學(xué)會的,而是通過一些干預(yù),通過講解將把自己的錯誤原因回溯而學(xué)會。
一起教育科技將這套系統(tǒng)智能教學(xué)系統(tǒng)分成幾個模塊,實現(xiàn)了診斷干預(yù)、再次講解,幫助孩子學(xué)會這個過程。一起教育科技也在線上進(jìn)行實驗評估這套系統(tǒng)是否有效,稱之為后測率指標(biāo)。后測率是孩子做錯一道題,給予相應(yīng)的干預(yù)、講解。未來,孩子可能在做類似錯題了后,我們看他做錯的比例是多少,故稱之為后測率。
使用這套系統(tǒng)后孩子的后測率對比原來未使用這套系統(tǒng),一起教育科技進(jìn)行了實驗班和實驗分組。結(jié)果所示學(xué)習(xí)效果提升了很多。
學(xué)科能力量尺搭建
學(xué)科能力量尺搭建,一起教育科技也稱之為智能評測技術(shù)。該技術(shù)相對傳統(tǒng),國內(nèi)外例如我國各省的教研專家委員會上,一些學(xué)科能力量尺在數(shù)學(xué)/語文/英語上都有相應(yīng)模型。其主要用于評估一個區(qū)域/一個學(xué)校/一個班級的教學(xué)效果。我們能夠形象的聯(lián)想到,班級學(xué)習(xí)效果是按考分進(jìn)行評估。
實際上,分?jǐn)?shù)是一個籠統(tǒng)概念,如何對應(yīng)到每個孩子的能力,如何對應(yīng)到班級整體能力,需要學(xué)科能力量尺進(jìn)行度量,用多個維度判斷孩子認(rèn)知、模型和相應(yīng)教學(xué)目標(biāo)是否達(dá)到?
以數(shù)學(xué)為例,一起教育科技覆蓋了七個常見教材版本,并在去年上線了一期項目,幫助公立學(xué)校完成其評估過程。學(xué)科能力評測目標(biāo)要有兩個:一是為區(qū)域教員(比如教育局委員會)提供教學(xué)質(zhì)量的監(jiān)督,同時微觀指導(dǎo)班級,甚至指導(dǎo)個人進(jìn)行學(xué)科能力評估,為班級/家長/老師輸出學(xué)生的學(xué)科能力的強(qiáng)項、弱項,指導(dǎo)日常工作。 學(xué)科能力量尺目前的覆蓋范圍大概有270萬學(xué)生,去年覆蓋7萬多個班級。
會員問答
為更深入的解決聽眾在AI+教育方面的困惑,「Live」在分享結(jié)束后開設(shè)問答環(huán)節(jié),楊康對旗下會員組織「AI投研邦」會員疑問進(jìn)行了一一解答。
問題一、某AI教育公司從業(yè)者:請問數(shù)學(xué)作業(yè)中的應(yīng)用題,目前可以實現(xiàn)自動批改嗎?
一定程度上是能的。一起教育科技在今年也將發(fā)布相應(yīng)技術(shù)。數(shù)學(xué)階段的應(yīng)用題批改,因其耗時較長,老師批改的時長也較大。一起教育科技認(rèn)為第一步是答案抽取,即答案在哪個區(qū)域?(比如用戶的答案可能是一個確定的數(shù)字+一個單位,答案在哪個區(qū)域需要識別出來);同時,一起教育科技也希望做到過程級批改,不只是一個答案,對學(xué)生在前面的三/五個過程中的回答點是否正確,是否按照思考路徑來進(jìn)行預(yù)期回答,一起教育也會進(jìn)行相應(yīng)處理。
問題二、AI+教育領(lǐng)域?qū)W生:請問在技術(shù)落地的過程中,有沒有遇到什么瓶頸?這些問題是如何解決的?
比如,一起教育科技在早期自動批改技術(shù)上線時,內(nèi)部評測效果較好;但實際第一次冷啟動上線時,你會看到線上效果比預(yù)期效果下降十個百分點甚至更多。
這個問題的瓶頸在哪里?主要是在樣本。線下測試集實驗時,訓(xùn)練樣本相對少,所以一起教育科技鼓勵在AI研發(fā)階段分成兩個階段:一是冷啟動階段,盡可能用能夠收集到的數(shù)據(jù)提高數(shù)據(jù)樣本的標(biāo)注準(zhǔn)確率,然后準(zhǔn)確度達(dá)到一個基礎(chǔ)分(基礎(chǔ)分不會太高,冷啟動一般來說較難)。
第二階段是線上放量,即實驗或正式生產(chǎn)階段。該階段可以看到各種各樣的樣本,原來的模型、原來的方法在這些樣本上工作效果的可能并不好,但一定要有很好的邊角案例管理意識和邊角案例跟蹤意識,將處理不好的問題單獨挑出,把樣本進(jìn)行針對性標(biāo)注。如此得到很好的提升。
問題三、某AI教育公司從業(yè)者:AI+教育,在推向K12學(xué)校時,面臨最大的問題是什么,我們是怎么應(yīng)對的?
一起教育科技已經(jīng)成立八年多,面對的問題多種多樣。 舉例來說,一起教育科技覆蓋的學(xué)校不只是信息化程度很好的北京、上海,也有信息化程度較差的城鎮(zhèn)鄉(xiāng)村小學(xué),在這些小學(xué)中,一起教育科技花費了很多精力思考如何賦能信息化教學(xué)程度較差的一些地區(qū)。但我們欣喜的發(fā)現(xiàn),即使在鄉(xiāng)村小學(xué),每個孩子的家庭中也有一部手機(jī),通過手機(jī)上網(wǎng)進(jìn)行口語打分、作業(yè)批改,可以讓老師跟蹤其學(xué)習(xí)情況,家長跟蹤學(xué)情。
所以,一起教育科技認(rèn)為移動互聯(lián)網(wǎng)帶來相對公平的教學(xué)機(jī)會,無需通過一個很大的多媒體教室才能完成口語教學(xué)過程。一起教育科技積極應(yīng)對此事,同時也希望未來將更多的線下作業(yè)場景搬到線上。因為孩子在上課過程中,如果能引用相應(yīng)的作業(yè)大數(shù)據(jù),可以看到“我的班級”、“我的年級”及全市區(qū)域的錯題分布。這樣即可幫助老師針對性的指導(dǎo)孩子。