← 전체 목록

2026-03-27 AI 리서치 브리핑

최신 VLM, sLLM, on-device AI 논문과 연구 블로그를 한눈에 정리합니다. 중복 기사 방지를 위해 URL 기준으로 추적합니다.

총 7건 요약 자동 생성

VLM 업데이트

멀티모달 비전-언어 모델의 최신 논문과 리더보드 변화

GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation

News Microsoft Research Blog

Vision-language models (VLMs) use images and text to plan robot actions, but they still struggle to decide what actions to take and where to take them. Most systems split these decisions into two steps: a VLM generates a plan in natural language, and a separate model translates it into executable actions. This approach often breaks […]

원문 보기

sLLM 트렌드

경량화·효율화를 위한 스몰 LLM 연구

Why Does Self-Distillation (Sometimes) Degrade the Reasoning Capability of LLMs?

Paper Hugging Face Papers

Why Does Self-Distillation (Sometimes) Degrade the Reasoning Capability of LLMs?에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.

원문 보기

AI 뉴스 & 리서치

기업/연구기관의 주요 발표와 블로그 업데이트

CUA-Suite: Massive Human-annotated Video Demonstrations for Computer-Use Agents

Paper Hugging Face Papers

CUA-Suite: Massive Human-annotated Video Demonstrations for Computer-Use Agents에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.

원문 보기

EVA: Efficient Reinforcement Learning for End-to-End Video Agent

Paper Hugging Face Papers

EVA: Efficient Reinforcement Learning for End-to-End Video Agent에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.

원문 보기

T-MAP: Red-Teaming LLM Agents with Trajectory-aware Evolutionary Search

Paper Hugging Face Papers

T-MAP: Red-Teaming LLM Agents with Trajectory-aware Evolutionary Search에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.

원문 보기

UI-Voyager: A Self-Evolving GUI Agent Learning via Failed Experience

Paper Hugging Face Papers

UI-Voyager: A Self-Evolving GUI Agent Learning via Failed Experience에 관한 최근 업데이트입니다. 자세한 내용은 원문 링크에서 확인할 수 있습니다.

원문 보기

AsgardBench: A benchmark for visually grounded interactive planning

News Microsoft Research Blog

AsgardBench evaluates whether embodied agents can revise their plans based on visual observations as tasks unfold. By focusing on perception-driven planning, it exposes key limitations and guides improvements in agent reliability.

원문 보기

참고한 소스