728x90 반응형 AI55 NVIDIA가 Eagle 2.5를 출시했습니다. 긴 장문 텍스트 이해 분야의 떠오르는 신성, 시각 언어 모델의 한계를 어떻게 극복할 것인가? 다중 모드 학습 분야에서 시각 언어 모델(VLM)의 급속한 발전은 다양한 모드를 통합하는 데 큰 잠재력이 있음을 보여주었습니다. 그러나 상당한 진전에도 불구하고 이러한 모델은 주로 짧은 텍스트 작업에 초점을 맞추고 있으며, 긴 텍스트를 이해하는 능력이 항상 약점이었습니다. 특히 긴 영상 이해와 고해상도 이미지/영상 이해를 다룰 때, 확장된 시각적 맥락을 효과적으로 처리하는 방법은 여전히 어려운 문제로 남아 있습니다.긴 텍스트를 이해하는 데 있어서의 딜레마와 과제긴 텍스트를 이해하는 데 부족한 점은 기존 시각 언어 모델이 데이터 세트 구축, 아키텍처 설계, 학습 전략, 컴퓨팅/메모리 병목 현상 등 많은 어려움에 직면하고 있기 때문입니다. 이전 연구에서는 컨텍스트 길이를 늘리려고 시도했지만, 그 결과는 .. 2025. 4. 28. NVIDIA, DAM-3B 발표: 이미지와 비디오의 현지화된 설명 “스타일”! 인공지능의 급속한 발전으로 다중 모드 학습이 점차 인기 있는 연구 분야가 되고 있습니다. 중요한 분야로서 시각 언어 모델(VLM)은 이미지와 비디오에 대한 전체적인 설명을 생성하는 데 있어 놀라운 성과를 거두었습니다. 하지만 이러한 모델에 이미지나 비디오의 특정 영역을 자세히 설명하도록 요청하면, 그 성능이 만족스럽지 않다는 것을 종종 발견하게 됩니다. 이러한 한계는 특히 비디오 데이터에서 두드러지게 나타나는데, 비디오는 공간 정보뿐만 아니라 시간적 동역학도 처리해야 하기 때문입니다. 다행히도 NVIDIA가 새롭게 출시한 DAM-3B(Describe Anything 3B) 모델이 우리에게 새로운 희망을 가져다줍니다.인공지능의 급속한 발전과 함께 멀티모달 학습은 점차 뜨거운 연구 분야로 떠오르고 있습니다.. 2025. 4. 28. 2025년 최고의 데이터 보안 플랫폼 데이터 생성, 저장 및 공유가 급속도로 증가함에 따라 데이터 보안은 필수이자 동시에 어려운 과제가 되었습니다. 데이터 침해, 사이버 공격, 내부자 위협은 정교한 솔루션을 필요로 하는 끊임없는 위험입니다. 바로 이러한 상황에서 데이터 보안 플랫폼이 중요한 역할을 하며, 기업은 민감한 정보를 보호하고 규정을 준수할 수 있는 중앙 집중식 도구와 전략을 제공받게 됩니다.데이터 보안 플랫폼의 핵심 구성 요소효과적인 DSP는 무단 접근, 오용 및 도난으로부터 데이터를 보호하기 위해 함께 작동하는 여러 핵심 구성 요소를 기반으로 구축됩니다. 구성 요소는 다음과 같습니다.1. 데이터 발견 및 분류데이터를 안전하게 보호하려면 먼저 데이터를 분류하고 이해해야 합니다. DSP에는 일반적으로 민감도와 용도에 따라 데이터를 자.. 2025. 4. 27. Google ADK (Agent Development Kit) 개요Google의 Agent Development Kit(ADK)는 2025년 4월 9일 Google Cloud NEXT 2025에서 공개된 오픈소스 프레임워크입니다. 이 프레임워크는 AI 에이전트와 멀티 에이전트 시스템의 개발을 단순화하고 효율화하기 위해 설계되었습니다. ADK는 Google 제품인 Agentspace와 Google Customer Engagement Suite(CES)에서 사용되는 것과 동일한 프레임워크로, 이제 개발자들이 자유롭게 활용할 수 있도록 오픈소스로 제공됩니다. 주요 특징1. 유연한 오케스트레이션워크플로우 에이전트(Sequential, Parallel, Loop)를 사용하여 예측 가능한 파이프라인 정의LLM 기반 동적 라우팅(LlmAgent 전송)을 활용한 적응형 동작 구현.. 2025. 4. 27. 2025년 4월 27일 AI 뉴스 『OpenAI, 비영리 뿌리에서 벗어나는 것에 대한 반대 의견 제기』소스 웹사이트: artificialintelligence-news.com링크: https://www.artificialintelligence-news.com/2025/04/24/openai-nonprofit-roots-history-ai-artificial-intelligence/요약: 전 OpenAI 직원들을 포함한 전문가 연합이 OpenAI가 비영리 뿌리에서 벗어나는 것에 강력히 반대하고 있습니다. 이들은 캘리포니아와 델라웨어 주 법무장관에게 보낸 공개 서한에서 제안된 변경 사항이 OpenAI의 원래 자선 사명을 근본적으로 위협한다고 주장합니다. OpenAI는 "인공 일반 지능(AGI)이 모든 인류에게 혜택을 주도록 보장"하기 위해 .. 2025. 4. 27. 2025년 4월 26일 AI 뉴스 『OpenAI, API에서 이미지 생성 모델 출시』출처 웹사이트: Hacker News (OpenAI 공식 발표)링크: https://openai.com/index/image-generation-api/요약: OpenAI가 ChatGPT에서 인기를 끌었던 이미지 생성 기능을 API를 통해 'gpt-image-1' 모델로 제공합니다. 이 모델은 다양한 스타일의 고품질 이미지를 생성할 수 있으며, 텍스트를 정확하게 렌더링하는 능력을 갖추고 있습니다. Adobe, Airtable, Figma, Gamma 등 주요 기업들이 이미 이 기능을 자사 제품에 통합하고 있습니다. 가격은 토큰 기반으로 책정되며, 저품질부터 고품질까지 이미지당 약 0.02에서0.19 사이입니다. 『RAGEN: AI 프레임워크, LLM 에이.. 2025. 4. 26. 이전 1 ··· 4 5 6 7 8 9 10 다음 728x90 반응형