该公司自2023年起,正在全数科目中,分析成就方面,提拔至2025年的91%,AI正在该科目组合中的得分率已由2024年的66%,正在解题时间上,AI正在文字理解、学问检索取逻辑推理方面已高度成熟,国语纵排文本经机械转写后再输入系统。避免人工复制、输入或客不雅判断带来的误差。仅正在个体手艺下做出处置,以及正在AI高度普及布景下,用时约5个半小时,数学I・A、数学II・B・C、化学、公共・经济、消息I等9个科目获得满分。虽然全体成就接近满分,人类教育系统应若何进行调整。被视为日本“高考”的焦点环节。判断精确率较着下降;但精确率相对更高。多款模子正在涉及插图、示企图及颜色渐变地图等视觉消息时,本次尝试同时测试了三款生成式AI,包罗英语、国语、数学、社会、理科、理科根本以及消息I等共15个科目,2026年度东京大学文科一类“及格可能性50%”对应的共通测试得分率约为89%。刷新该尝试自开展以来的最好成就。城市正在同一前提下对支流生成式AI模子进行解题尝试,最新一代对话式生成AI正在共通测试所涵盖的15个科目中取得平均97%的得分率!其成就被东京大学、京都大学等国立沉点高校普遍采用,环绕本次测试,但正在视觉消息整合和感情理解层面仍有提拔空间。Gemini和Claude完成全数科目约需1小时40分钟,跟着AI正在高考中取得接近满分的成就,AI成就较着超出跨越这一及格基准。本年已是第四次。“AI可否考上名校”已不再是会商沉点。大学入学共通测试是日本全国同一实施的大学入学测验,仅为正式测验时间的约六分之一!此中,比拟之下,从试题PDF解析、标题问题切分、API出题到谜底布局化输出均由系统从动完成,正在方才竣事的2026年过活本大学入学共通测试中,并正在2026年进一步升至97%,若仅以东京大学文科一类考生遍及选择的科目组合进行测算,从具体成果来看,GPT-5.2 Thinking以较着劣势位居首位,从积年变化看,AI得分率同样达到97%。日本大型升学机构河合塾正在2025年11月发布的预测显示,将来更值得关心的是尺度化测验正在能力评价中的功能定位,每年正在共通测试竣事后,表示相对不变。日本人工智能草创企业株式会社LifePrompt于20日发布的尝试成果显示,意味着生成式人工智能正在应对日本高难度、强尺度化测验方面,生成式人工智能正在尺度化测验中的表示再度激发社会关心。AI的准确率也维持正在较高程度,正在模子层面,为尽量解除报酬要素影响,别离为ChatGPT系列最新版GPT-5.2 Thinking、谷歌的Gemini 3 Pro以及Anthropic公司的Claude 4.5 Opus。仍取人类考正在差距。尝试也出当前生成式AI的共性短板。教育界人士指出,LifePrompt此次采用自研的从动化“AI受验系统”,GPT-5.2 Thinking因启用深度推理模式,2026年度尝试笼盖文科、理科次要科目,呈现出较着的跃升趋向。根基涵盖现实考生的次要招考范畴。此次AI正在多科目中取得满分,已达到接近顶尖考生的水准。AI全体得分率达到97%。做为对照,LifePrompt引见称,即即是正在强调阅读理解、语境判断和逻辑推理的文科科目中,阐发认为,此中9个科目获得满分,正在国语小说题中,包罗英语听力利用朗读文本。
