學生交暑假作業給AI,有很乖的,自然也有很乖張的。
不出意外,同學成父子藉玩壞AI彼此戲謔的事兒,很快冒頭。還沒見過,判斷不了他們彼此玩笑尺度,所以管了兩個用戶名加了禁止指令,然後繼續看。還好,也就一晚上一上午就基本消停了。實時看完,原因倒也簡單,你可以他也可以用的武器,確實更容易達成威懾平衡。
借鑑Roast X和Grok的AI,迄今整體評閱還不錯。學生開始了解召喚grader方式,直面吐槽。沒有意外的話,很多人是被扎了下心的。
絕大多數暑期作業根本不需要老師看,畢竟也沒幾個真的認真在做。但癥結還是在於,作業的靈魂從來不是給別人看。看這一輪AI審閱效果,明顯從網上抄來的文字直接被AI斥罵,秒回互動,逐層剖析⋯⋯這已經是AI的主場,我要做的就是看著,點點讚。
設定了提交作業的框架,優勢是模板清晰,但這也導致過於省略的答案,譬如學生直接在論語閱讀題回了喪家狗,AI直接懵圈了就。考慮上傳相關文件讓AI先檢索再回應,或者可以解決。
圖片還是硬傷,中文且手寫OCR⋯⋯太難了,對比英文圖片的處理,從學界到技術界,都遙遙領先個狗屎!一如中文的Tokenizer,你不能指望非母語的人幫你處理這些的⋯⋯
不出意外,同學成父子藉玩壞AI彼此戲謔的事兒,很快冒頭。還沒見過,判斷不了他們彼此玩笑尺度,所以管了兩個用戶名加了禁止指令,然後繼續看。還好,也就一晚上一上午就基本消停了。實時看完,原因倒也簡單,你可以他也可以用的武器,確實更容易達成威懾平衡。
開發者模式的坑沒全填死,髒話還是有幾句的,留著,下週上課見面,一起賞析。真實的AI世界,這問題原本就迴避不開。如果有能從這裡切入最終走入真開發的學生,自然是好事;如果衹是胡撕亂打,寶山空回就成了注定;但目力所及,以國內開發環境,前者太難;後者,真的容易。唉。
借鑑Roast X和Grok的AI,迄今整體評閱還不錯。學生開始了解召喚grader方式,直面吐槽。沒有意外的話,很多人是被扎了下心的。
絕大多數暑期作業根本不需要老師看,畢竟也沒幾個真的認真在做。但癥結還是在於,作業的靈魂從來不是給別人看。看這一輪AI審閱效果,明顯從網上抄來的文字直接被AI斥罵,秒回互動,逐層剖析⋯⋯這已經是AI的主場,我要做的就是看著,點點讚。
設定了提交作業的框架,優勢是模板清晰,但這也導致過於省略的答案,譬如學生直接在論語閱讀題回了喪家狗,AI直接懵圈了就。考慮上傳相關文件讓AI先檢索再回應,或者可以解決。
圖片還是硬傷,中文且手寫OCR⋯⋯太難了,對比英文圖片的處理,從學界到技術界,都遙遙領先個狗屎!一如中文的Tokenizer,你不能指望非母語的人幫你處理這些的⋯⋯
之前一直沒啟用nsfw,已經啟用。但都不是小孩子,尺度在哪裡,看實際發帖,還是清楚的。
之前沒怎麼細審,這兩天帖子增多,構想紅線底線,發現Discourse的帖子管理邏輯是真的細密,真出現問題,直接將帖子對話做私密,限制回復時間,監督全域字詞,好消息是,這些都沒用到。月度$300的定價還是有原因的。
前天更新了端點gemini-1.5-pro-exp-0827,不到百人的班級80幾人並行在線,併發對話免費API直接超限,付費API部署好,待啟用。GPT-4omini呢,繼續備用。
Comments
Post a Comment