Open VLM Leaderboard - a Hugging Face Space by opencompass
Open VLM Leaderboard - a Hugging Face Space by opencompass에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기최신 VLM, sLLM, on-device AI 논문과 연구 블로그를 한눈에 정리합니다. 중복 기사 방지를 위해 URL 기준으로 추적합니다.
멀티모달 비전-언어 모델의 최신 논문과 리더보드 변화
Open VLM Leaderboard - a Hugging Face Space by opencompass에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기경량화·효율화를 위한 스몰 LLM 연구
Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기디바이스 내 추론 및 엣지 최적화 동향
KnowRL: Boosting LLM Reasoning via Reinforcement Learning with Minimal-Sufficient Knowledge Guidance에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기Turing Test on Screen: A Benchmark for Mobile GUI Agent Humanization에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기Google AI Edge | Google AI for Developers에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기기업/연구기관의 주요 발표와 블로그 업데이트
ClawGUI: A Unified Framework for Training, Evaluating, and Deploying GUI Agents에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기April 13, 2026 Towards developing future-ready skills with generative AI Education Innovation · Generative AI에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기April 9, 2026 ConvApparel: Measuring and bridging the realism gap in user simulators Generative AI · Machine Intelligence · Natural Language Processing에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기April 8, 2026 Improving the academic workflow: Introducing two AI agents for better figures and peer review Generative AI · Natural Language Processing에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기April 3, 2026 Evaluating alignment of behavioral dispositions in LLMs Generative AI · Human-Computer Interaction and Visualization · Machine Intelligence에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기Google Research explores the trade-off between number of items and human raters per item to improve AI benchmark reproducibility and capture the nuance of human disagreement.
원문 보기The Microsoft Research blog provides in-depth views and perspectives from our researchers, scientists and engineers, plus announcements about noteworthy events, scholarships, and fellowships designed for academic and scientific communities.
원문 보기For the past five years, the New Future of Work report has captured how work is changing. This year, the shift feels especially sharp. Previous editions have focused on technology’s role in increasing productivity by automating tasks, accelerating communication, and expanding access to information, as well as the rise of remote work. Today, generative AI […]
원문 보기ADeLe: Predicting and explaining AI performance across tasks에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기AsgardBench: A benchmark for visually grounded interactive planning에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.
원문 보기