Google DeepMind がシエラレオネでのAI学習効果測定結果を公開 ── Geminiの「ソクラテス式」アプローチが効く
Google DeepMindがシエラレオネで実施した8週間のRCT結果。Geminiが答えの2%しか直接提示せず、76%で問い返す設計が功を奏した。
Google DeepMindがシエラレオネで実施した8週間のRCT結果。Geminiが答えの2%しか直接提示せず、76%で問い返す設計が功を奏した。
エージェントがideogram4とTripoSplatの2つのSpaceを連鎖させ、パリの記念碑を3D Gaussian splatで展示するギャラリーを全自動で構築した事例を紹介。
Zhipu AIがオープンソースのキャラクター動画モデル「SCAIL-2」を公開。骨格抽出なしでエンドツーエンド駆動し、動物の動きにも対応。
ADHD脳のフリーズ状態に「小さな一歩」を届けるNeuroBait。奥さんのために開発された、todoリストではないアプローチ。
5つの異なるAIモデルで経済シミュレーションしたら暴落が消えた。エージェント経済の価格は設定ではなく創発の残骸であるという教訓。
Hugging FaceのOpenEnvがNvidiaやPyTorch Foundationらとコミュニティ主導へ。エージェントRL環境の標準規格を目指す動き。
パキスタンの詐欺メッセージ対策に特化したAIツール「Pakistan Notice Helper」。Qwen3.5 4Bを活用し、ローカルな安全問題に挑む。
Nemotron 30bを使いthree.jsゲームの自動生成に挑んだが失敗。最終的に簡単なHTMLトイメーカーへと転身したプロジェクトの記録。
Claude Codeの.jsonlセッションログを解析し、エージェントの挙動やトークン消費、リスクの高い操作を特定するツール「Her · हेर」が登場した。
Thousand Token Wood v2は4ラボの小規模モデルが混在する仮想経済シミュレーション。異種モデルが生む本物の多様性を体感。