K12個(gè)性化學(xué)習(xí)AI軟件開(kāi)發(fā)
大家好,我們是成都小火科技,今天是2025年8月26日,星期二。我們公司成立于2013年,自主的軟件開(kāi)發(fā)團(tuán)隊(duì)。目前我們開(kāi)發(fā)的APP等軟件系統(tǒng)中,90%都有AI的功能。今天我們來(lái)介紹K12個(gè)性化學(xué)習(xí)AI軟件的開(kāi)發(fā)。
項(xiàng)目啟動(dòng)初期,團(tuán)隊(duì)用了兩個(gè)月時(shí)間做需求對(duì)接。主要對(duì)接對(duì)象包括三所K12學(xué)校的教師、學(xué)生和家長(zhǎng)代表,以及教育研究院的課程專(zhuān)家。教師群體提出的需求集中在作業(yè)批改效率和學(xué)生知識(shí)點(diǎn)薄弱點(diǎn)定位上,例如初中數(shù)學(xué)老師每周需要花6-8小時(shí)批改計(jì)算類(lèi)作業(yè),希望能自動(dòng)分析錯(cuò)題涉及的公式應(yīng)用錯(cuò)誤類(lèi)型;學(xué)生群體的核心訴求是減少重復(fù)練習(xí)時(shí)間,比如小學(xué)五年級(jí)學(xué)生反映英語(yǔ)單詞聽(tīng)寫(xiě)正確率穩(wěn)定在90%以上,希望減少該類(lèi)單詞的重復(fù)背誦任務(wù);家長(zhǎng)群體關(guān)注學(xué)習(xí)過(guò)程的透明度,需要每周收到包含學(xué)習(xí)時(shí)長(zhǎng)、知識(shí)點(diǎn)掌握進(jìn)度、與班級(jí)平均水平對(duì)比的文字報(bào)告。教育專(zhuān)家則強(qiáng)調(diào)軟件需符合國(guó)家課程標(biāo)準(zhǔn),知識(shí)點(diǎn)標(biāo)簽體系要與人教版、北師大版等主流教材完全對(duì)應(yīng)。這些需求被整理成237條具體功能點(diǎn),其中12條因技術(shù)實(shí)現(xiàn)難度過(guò)高或與教育規(guī)律沖突被篩除,最終保留225條進(jìn)入開(kāi)發(fā)清單。
數(shù)據(jù)采集階段涉及多源數(shù)據(jù)整合。首先是學(xué)校現(xiàn)有教學(xué)系統(tǒng)的歷史數(shù)據(jù),包括近三年的期中期末試卷、單元測(cè)試卷,以及部分班級(jí)的課堂答題器記錄。其次是新增的實(shí)時(shí)數(shù)據(jù)采集,通過(guò)開(kāi)發(fā)輕量級(jí)客戶(hù)端嵌入學(xué)校已有的在線學(xué)習(xí)平臺(tái),采集學(xué)生日常作業(yè)的答題軌跡(如數(shù)學(xué)大題的步驟輸入時(shí)間、修改次數(shù))、口語(yǔ)練習(xí)的音頻流(用于發(fā)音準(zhǔn)確度分析)、閱讀類(lèi)應(yīng)用的翻頁(yè)和標(biāo)注行為。數(shù)據(jù)采集過(guò)程中遇到兩個(gè)關(guān)鍵問(wèn)題:一是部分學(xué)校使用的是自研教學(xué)系統(tǒng),數(shù)據(jù)格式不統(tǒng)一,團(tuán)隊(duì)用了一個(gè)半月開(kāi)發(fā)數(shù)據(jù)轉(zhuǎn)換中間件,將27種不同格式的JSON和CSV文件統(tǒng)一為系統(tǒng)可識(shí)別的XLSX格式;二是手寫(xiě)作業(yè)的數(shù)字化問(wèn)題,小學(xué)階段約40%的作業(yè)為手寫(xiě),團(tuán)隊(duì)引入OCR識(shí)別技術(shù),針對(duì)小學(xué)生字跡潦草的特點(diǎn)優(yōu)化模型,將數(shù)字和符號(hào)的識(shí)別準(zhǔn)確率從初始的82%提升至95%,漢字識(shí)別準(zhǔn)確率從78%提升至89%。
數(shù)據(jù)處理環(huán)節(jié)包含清洗、標(biāo)注和脫敏三個(gè)步驟。清洗階段處理了約12TB的原始數(shù)據(jù),剔除無(wú)效記錄(如答題時(shí)間小于1秒的測(cè)試提交)、修正異常值(如某學(xué)生數(shù)學(xué)考試得分顯示為150分,經(jīng)核查為系統(tǒng)錄入錯(cuò)誤)、統(tǒng)一時(shí)間戳格式(將不同時(shí)區(qū)的記錄轉(zhuǎn)換為北京時(shí)間)。標(biāo)注階段由15名教育專(zhuān)業(yè)實(shí)習(xí)生和3名一線教師組成的團(tuán)隊(duì)完成,為每條數(shù)據(jù)添加知識(shí)點(diǎn)標(biāo)簽(如“人教版七年級(jí)數(shù)學(xué) 上冊(cè) 第三章 一元一次方程 解方程”)、錯(cuò)誤類(lèi)型標(biāo)簽(如“公式記憶錯(cuò)誤”“計(jì)算步驟遺漏”“題意理解偏差”),共標(biāo)注了87萬(wàn)條數(shù)據(jù)記錄,標(biāo)注一致性通過(guò)Kappa系數(shù)檢驗(yàn)達(dá)到0.89。脫敏階段對(duì)涉及學(xué)生個(gè)人信息的數(shù)據(jù)進(jìn)行加密處理,使用AES-256算法對(duì)姓名、學(xué)號(hào)、聯(lián)系方式進(jìn)行加密存儲(chǔ),僅保留用于模型訓(xùn)練的匿名化ID,所有數(shù)據(jù)處理過(guò)程均通過(guò)教育部門(mén)的安全合規(guī)審查。
算法模型開(kāi)發(fā)是核心環(huán)節(jié)。團(tuán)隊(duì)選擇了混合模型架構(gòu):基礎(chǔ)層使用XGBoost算法處理結(jié)構(gòu)化數(shù)據(jù)(如考試成績(jī)、作業(yè)正確率),用于預(yù)測(cè)學(xué)生的知識(shí)點(diǎn)掌握概率;中間層用LSTM神經(jīng)網(wǎng)絡(luò)分析非結(jié)構(gòu)化數(shù)據(jù)(如答題步驟的時(shí)間序列、口語(yǔ)錄音的聲學(xué)特征),捕捉學(xué)習(xí)行為的時(shí)間依賴(lài)性;應(yīng)用層通過(guò)知識(shí)圖譜關(guān)聯(lián)知識(shí)點(diǎn),構(gòu)建學(xué)生個(gè)人的知識(shí)漏洞網(wǎng)絡(luò)。模型訓(xùn)練使用了學(xué)校提供的2019-2024年共6年的脫敏數(shù)據(jù)集,按7:2:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。初始模型在驗(yàn)證集上的知識(shí)點(diǎn)預(yù)測(cè)準(zhǔn)確率為73%,通過(guò)調(diào)整LSTM的隱藏層數(shù)量和XGBoost的學(xué)習(xí)率參數(shù),準(zhǔn)確率提升至81%;針對(duì)初中物理力學(xué)部分的特殊需求(學(xué)生常因受力分析錯(cuò)誤導(dǎo)致解題失?。瑘F(tuán)隊(duì)額外標(biāo)注了2萬(wàn)條受力分析圖的特征數(shù)據(jù),引入計(jì)算機(jī)視覺(jué)模型識(shí)別受力方向和大小,將該知識(shí)點(diǎn)的預(yù)測(cè)準(zhǔn)確率從65%提升至83%。模型訓(xùn)練耗時(shí)3個(gè)月,期間進(jìn)行了17次參數(shù)調(diào)優(yōu)和5次架構(gòu)調(diào)整。
功能模塊開(kāi)發(fā)分為四個(gè)核心子系統(tǒng)。智能診斷子系統(tǒng)基于訓(xùn)練好的模型,輸入學(xué)生最近30天的學(xué)習(xí)數(shù)據(jù),生成包含12個(gè)維度的診斷報(bào)告,每個(gè)維度顯示掌握程度(低/中/高)、最近一次測(cè)試的表現(xiàn)趨勢(shì)、建議的補(bǔ)救措施(如“建議完成人教版七年級(jí)數(shù)學(xué)第三章習(xí)題1-5”)。資源推薦子系統(tǒng)依托知識(shí)圖譜和協(xié)同過(guò)濾算法,為每個(gè)學(xué)生生成個(gè)性化資源列表,包含題目(難度系數(shù)匹配當(dāng)前水平)、視頻(講解風(fēng)格匹配學(xué)習(xí)偏好)、文檔(補(bǔ)充拓展內(nèi)容),推薦準(zhǔn)確率通過(guò)A/B測(cè)試驗(yàn)證,初期為68%,上線前優(yōu)化至82%。學(xué)習(xí)路徑規(guī)劃子系統(tǒng)根據(jù)診斷結(jié)果和資源推薦結(jié)果,動(dòng)態(tài)生成每日學(xué)習(xí)任務(wù)清單,考慮學(xué)生的學(xué)習(xí)節(jié)奏(如晚8點(diǎn)后效率下降,減少高強(qiáng)度計(jì)算任務(wù))、剩余課時(shí)(如距離期中考試還有15天,增加重點(diǎn)章節(jié)練習(xí)量)、疲勞度(連續(xù)學(xué)習(xí)40分鐘后推薦5分鐘眼保健操視頻)。家校同步子系統(tǒng)開(kāi)發(fā)了家長(zhǎng)端小程序,支持查看孩子的診斷報(bào)告、學(xué)習(xí)進(jìn)度、資源使用情況,設(shè)置消息提醒(如“您的孩子已完成今日數(shù)學(xué)練習(xí),正確率85%”),消息推送頻率可由家長(zhǎng)自定義(每日/每周/每月)。
測(cè)試優(yōu)化階段分為內(nèi)部測(cè)試和外部試點(diǎn)。內(nèi)部測(cè)試持續(xù)了45天,團(tuán)隊(duì)模擬了200名不同年級(jí)、不同學(xué)科的學(xué)生用戶(hù),覆蓋了從小學(xué)一年級(jí)到高中三年級(jí)的全學(xué)段,測(cè)試用例包括正常操作(提交作業(yè)、查看報(bào)告)、異常操作(連續(xù)快速點(diǎn)擊按鈕、輸入非法字符)、極端場(chǎng)景(網(wǎng)絡(luò)中斷時(shí)提交作業(yè)、設(shè)備離線時(shí)使用緩存資源),共發(fā)現(xiàn)并修復(fù)了327個(gè)bug,其中影響核心功能的嚴(yán)重bug有12個(gè)(如知識(shí)點(diǎn)標(biāo)簽關(guān)聯(lián)錯(cuò)誤導(dǎo)致推薦資源完全偏離),一般功能問(wèn)題289個(gè)(如界面排版錯(cuò)位、加載動(dòng)畫(huà)卡頓),性能問(wèn)題26個(gè)(如大數(shù)據(jù)量查詢(xún)響應(yīng)時(shí)間超過(guò)2秒)。外部試點(diǎn)在成都的兩所公立小學(xué)和一所初中進(jìn)行,共有1200名學(xué)生、80名教師、150名家長(zhǎng)參與,試點(diǎn)周期為3個(gè)月。試點(diǎn)期間收集到教師反饋67條(如“診斷報(bào)告中的建議措施不夠具體,希望增加例題鏈接”)、學(xué)生反饋123條(如“資源推薦列表的分類(lèi)不夠清晰,找起來(lái)麻煩”)、家長(zhǎng)反饋89條(如“消息提醒太多,希望能折疊不重要的通知”)。針對(duì)這些反饋,團(tuán)隊(duì)調(diào)整了診斷報(bào)告的建議模塊(增加例題鏈接和視頻講解入口)、優(yōu)化了資源推薦列表的分類(lèi)標(biāo)簽(從5類(lèi)增加到8類(lèi))、修改了家長(zhǎng)端的消息提醒設(shè)置(增加折疊功能和重要性分級(jí))。
軟件正式上線前,團(tuán)隊(duì)完成了最后的性能壓測(cè)和安全審計(jì)。壓測(cè)結(jié)果顯示,系統(tǒng)在同時(shí)在線10萬(wàn)名學(xué)生、每秒處理5000次請(qǐng)求的情況下,響應(yīng)時(shí)間保持在1.2秒以?xún)?nèi),符合教育類(lèi)軟件的性能要求。安全審計(jì)由第三方機(jī)構(gòu)完成,確認(rèn)系統(tǒng)符合《個(gè)人信息保護(hù)法》《未成年人網(wǎng)絡(luò)保護(hù)條例》等法規(guī)要求,數(shù)據(jù)存儲(chǔ)和傳輸?shù)陌踩赃_(dá)到等保三級(jí)標(biāo)準(zhǔn)。截至2025年8月,該軟件已在15所K12學(xué)校開(kāi)展規(guī)?;瘧?yīng)用,覆蓋學(xué)生8000余人,教師1200余人,家長(zhǎng)1.5萬(wàn)人。根據(jù)試點(diǎn)學(xué)校的統(tǒng)計(jì)數(shù)據(jù),學(xué)生日均無(wú)效練習(xí)時(shí)間減少35分鐘,教師作業(yè)批改時(shí)間減少2.8小時(shí)/周,家長(zhǎng)對(duì)學(xué)生學(xué)習(xí)情況的了解度從42%提升至78%。這些數(shù)據(jù)驗(yàn)證了開(kāi)發(fā)過(guò)程中各項(xiàng)需求的實(shí)現(xiàn)效果,也為后續(xù)版本的迭代優(yōu)化提供了實(shí)證依據(jù)。
文章來(lái)源網(wǎng)址:http://www.cndaixiao.net/archives/xitongkaifa01/2096,轉(zhuǎn)載請(qǐng)注明出處!





精選案例
推薦文章
Core competence
高質(zhì)量軟件開(kāi)發(fā)公司-成都小火科技
多一套方案,多一份選擇
聯(lián)系小火科技項(xiàng)目經(jīng)理,免費(fèi)獲取專(zhuān)屬《項(xiàng)目方案》及開(kāi)發(fā)報(bào)價(jià)
咨詢(xún)相關(guān)問(wèn)題或預(yù)約面談,可以通過(guò)以下方式與我們聯(lián)系
業(yè)務(wù)熱線 19113551853

