(2026/5/18号)週刊AIニュース Mythos日本上陸など

Big News

Anthropic Mythos 日本上陸

5/14(木)Anthropic Mythosが一部の日本企業に展開されるとの報道があった。https://news.yahoo.co.jp/articles/216cdfaf8443e491f2341090370e2fdb90d14ac0 https://www.nikkei.com/article/DGXZQOUB130SI0T10C26A5000000/

Mythosはコーディング能力に優れておりサイバーセキュリティにおける攻撃能力が極めて高いことから一般公開はされていないモデルであった。アメリカでは事前に大手テック・金融機関・政府機関などの約40〜50社にのみ公開されていたが、日本企業に展開されるのは初となる。

高性能なLLMが出る前から、セキュリティ分野では防御側に比べて攻撃者が有利である(Attacker's Advantage)という通説があるが、その差がより顕著になる時代となった。LLMの発展に比例して今後セキュリティインシデントの数が増加すると予測される。

Google I/O 2026においてGemini新モデル発表か

https://gigazine.net/news/20260515-google-gemini-spark/

2026年5月19日から2日間にわたってGoogle I/O 2026がカリフォルニアにて開催される。そこでGeminiの新モデルが発表されると報道されている。

Googleの最新モデルであるGemini 3.1 Proは2025年4月から2026年3月にかけてシェアが6%から25%と急成長(Webトラフィックによる計算)しているが、4月16日に発表されたClaude Opus 4.7や4月23日に発表されたGPT-5.5に比べて種々のベンチマーク性能で下回っているため、同等かそれ以上の性能を持つモデルとなることが期待される。

引用: https://fatjoe.com/blog/chatgpt-stats/

引用: https://openai.com/ja-JP/index/introducing-gpt-5-5/

arXivがLLMによる誤りやハルシネーションを含む論文を投稿した著者にペナルティを課すことを決定

https://gigazine.net/news/20260515-arxiv-ai-paper-banned/

arXivは物理学、数学、コンピュータサイエンスなどの分野で、査読前の論文を公開するオンライン・リポジトリである。
コンピュータサイエンス分野に関しては年間約30%のペースで論文投稿数が増加している。

引用: https://info.arxiv.org/about/reports/submission_category_by_year.html

今回の変更では、LLMによって生成された偽の論文引用やLLMによるメタコメント（「以下に200語の要約を示します。変更しますか？」のようなもの）が含まれるような明確な証拠がある場合には、著者のarXivへの投稿が1年間禁止となる重い処罰が下される。

論文

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

https://arxiv.org/abs/2605.05242

Claude CodeやBashを用いた簡易Agentによる文章抽出が既存のベクトル検索よりも高性能であることを示した論文。

提案されたモデルは以下の2つ。DCI-Agent-ClaudeCodeに関してはClaude Codeをそのまま使用して検証している。

エージェント名	ベースモデル（推論設定）	設計コンセプトと検証目的
DCI-AgentLite	GPT-5.4 nano (Reasoning: High)	低予算・軽量設定：最小限のコマンド（ bash / read ）と軽量な文脈管理で、長期の探索能力を評価する。
DCI-Agent-ClaudeCode	Claude Sonnet 4.6 (Reasoning: Medium)	高容量・最高性能設定：Web検索やデータアクセス等の制限（リーク防止）下で、手法の性能限界（天井）を検証する。

エージェント名

ベースモデル（推論設定）

設計コンセプトと検証目的

DCI-AgentLite

GPT-5.4 nano

(Reasoning: High)

低予算・軽量設定：最小限のコマンド（

bash

read

）と軽量な文脈管理で、長期の探索能力を評価する。

DCI-Agent-ClaudeCode

Claude Sonnet 4.6

(Reasoning: Medium)

高容量・最高性能設定：Web検索やデータアクセス等の制限（リーク防止）下で、手法の性能限界（天井）を検証する。

従来のベクトル検索ベースの手法は関連文書を「見つける」のは得意だが、その中から正確な答えを「抽出する」行動がうまくできないためDCIが圧勝しているとのこと。

株式会社MyVision開発部のテックブログです！採用情報はこちら corporate.my-vision.co.jp/engineering-careers

(2026/5/18号)週刊AIニュース Mythos日本上陸など

추출된 키워드

원문

(2026/5/18号)週刊AIニュース Mythos日本上陸など

Big News

Anthropic Mythos 日本上陸

Google I/O 2026においてGemini新モデル発表か

arXivがLLMによる誤りやハルシネーションを含む論文を投稿した著者にペナルティを課すことを決定

論文

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction