『DeepSeek의 분산 파일 시스템 소개』
출처 웹사이트: Hacker News
링크: https://maknee.github.io/blog/2025/3FS-Performance-Journal-1/
요약: DeepSeek가 오픈소스로 공개한 3FS(Fire-Flyer File System)는 대규모 데이터를 처리할 수 있는 분산 파일 시스템입니다. 이 시스템은 Meta(메타데이터 관리), Mgmtd(클러스터 구성 관리), Storage(실제 파일 데이터 저장), Client(다른 노드와 통신) 등 네 가지 주요 노드 유형으로 구성되어 있습니다. 3FS는 CRAQ(Chain Replication with Apportioned Queries) 프로토콜을 사용하여 강력한 일관성과 내결함성을 제공합니다. 이 시스템은 AI 학습 파이프라인, 대규모 코드/데이터 저장소, 산업 응용 프로그램 등 다양한 분야에서 활용될 수 있으며, 특히 ML 훈련 및 체크포인팅에 유용합니다.
『MCP Run Python: 샌드박스에서 Python 코드 실행』
출처 웹사이트: Hacker News
링크: https://github.com/pydantic/pydantic-ai/tree/main/mcp-run-python
요약: Pydantic AI가 개발한 MCP(Model Context Protocol) Run Python은 샌드박스 환경에서 Python 코드를 안전하게 실행할 수 있는 서버입니다. 이 도구는 Pyodide를 Deno에서 실행하여 운영 체제와 격리된 환경을 제공합니다. 개발자는 이 서버를 Stdio MCP 전송(로컬 하위 프로세스로 실행), SSE MCP 전송(HTTP 서버로 실행) 또는 웜업 모드(Python 표준 라이브러리 다운로드 및 캐싱)로 실행할 수 있습니다. 이 도구는 PydanticAI와 함께 사용하여 AI 에이전트가 안전하게 Python 코드를 실행할 수 있게 해줍니다.
『AI를 활용한 럭비 경기 분석』
출처 웹사이트: Hacker News
링크: https://nickjones.tech/ai-watching-rugby/
요약: Gainline 앱의 개발자는 AI를 활용하여 럭비 경기를 분석하는 프로토타입 시스템을 구축했습니다. 이 시스템은 경기 영상을 5초마다 스크린샷으로 캡처하여 OpenAI의 비전 모델에 전송하고, 스코어보드와 경과 시간 등의 정보를 추출합니다. 또한 OpenAI Whisper를 사용하여 심판과 해설자의 오디오를 텍스트로 변환함으로써 경기 중 발생하는 세부 상황과 맥락을 파악합니다. 이 접근 방식은 기존의 구조화된 이벤트 피드가 제공하지 못하는 경기의 맥락과 세부 정보를 제공하며, 팬들에게 더 풍부한 경기 경험을 제공할 수 있습니다.
『Meta FAIR, 인간과 유사한 AI 개발을 위한 5가지 주요 기술 공개』
출처 웹사이트: Artificial Intelligence News
링크: https://www.artificialintelligence-news.com/news/meta-fair-advances-human-like-ai-five-major-releases/
요약: Meta의 Fundamental AI Research(FAIR) 팀이 고급 기계 지능(AMI) 개발을 위한 5가지 주요 프로젝트를 발표했습니다. 이 프로젝트들은 AI 인식 능력 향상에 중점을 두고 있으며, 언어 모델링, 로봇 공학, 협업 AI 에이전트 분야의 발전도 포함합니다. 주요 기술로는 다양한 이미지 및 비디오 작업에 탁월한 성능을 보이는 'Perception Encoder', 복잡한 시각적 인식 작업을 위한 'Perception Language Model(PLM)', 로봇이 3D 환경에서 객체를 정확히 찾을 수 있게 하는 'Meta Locate 3D', 효율적이고 강력한 언어 모델링을 위한 'Dynamic Byte Latent Transformer', 그리고 인간이나 다른 AI와 효과적으로 협업할 수 있는 AI 에이전트 개발을 위한 'Collaborative Reasoner'가 있습니다.
『화웨이, 엔비디아의 지배에 도전하는 AI 하드웨어 혁신 발표』
출처 웹사이트: Artificial Intelligence News
링크: https://www.artificialintelligence-news.com/news/huawei-ai-hardware-breakthrough-challenges-nvidia-dominance/
요약: 중국 기업 화웨이가 'CloudMatrix 384 Supernode'라는 강력한 새로운 컴퓨팅 시스템을 발표했습니다. 이 시스템은 미국 칩 리더 엔비디아의 유사 기술보다 우수한 성능을 보인다고 현지 언론이 보도했습니다. CloudMatrix 384 Supernode는 300 페타플롭스의 컴퓨팅 파워를 제공하며, 이는 엔비디아의 NVL72 시스템이 제공하는 180 페타플롭스를 초과하는 수치입니다. 특히 주목할 만한 점은 화웨이가 미국의 엄격한 기술 제한에도 불구하고 이러한 혁신을 이루어냈다는 것입니다. 이 시스템은 중국의 AI 컴퓨팅 인프라 구축 노력의 일환으로, 알리바바 그룹이 3년간 380억 위안(524억 달러)을 컴퓨팅 자원과 AI 인프라에 투자한다는 발표에 이어 나온 것입니다.
『DolphinGemma: 구글의 AI 모델이 돌고래 소통 방식 이해』
출처 웹사이트: Artificial Intelligence News
링크: https://www.artificialintelligence-news.com/news/dolphingemma-google-ai-model-understands-dolphin-chatter/
요약: 구글이 돌고래의 의사소통 방식을 해독하고 종간 의사소통을 촉진하기 위한 'DolphinGemma'라는 AI 모델을 개발했습니다. 조지아 공과대학 엔지니어와 Wild Dolphin Project(WDP)의 현장 연구를 활용한 이 모델은 돌고래 소리의 구조를 학습하고 새로운 돌고래 유사 오디오 시퀀스를 생성할 수 있습니다. DolphinGemma는 SoundStream 토크나이저를 사용하여 돌고래 소리를 효율적으로 표현하며, 구글의 Gemma 모델 기술을 기반으로 합니다. 약 4억 개의 매개변수를 가진 이 모델은 구글 Pixel 스마트폰에서도 효율적으로 실행될 수 있도록 최적화되었습니다. 구글은 올 여름 DolphinGemma를 오픈 모델로 공개할 예정이며, 이를 통해 전 세계 연구자들이 다양한 고래류 음향 데이터셋을 분석할 수 있게 될 것입니다.
『OpenAI, 저렴하고 느린 AI 작업을 위한 Flex 처리 출시』
출처 웹사이트: TechCrunch
링크: https://techcrunch.com/2025/04/17/openai-launches-flex-processing-for-cheaper-slower-ai-tasks/
요약: OpenAI가 'Flex 처리'라는 새로운 API 옵션을 출시했습니다. 이 옵션은 응답 시간이 느리고 "가끔 리소스를 사용할 수 없는" 대신 더 저렴한 AI 모델 사용 가격을 제공합니다. 최근 출시된 o3 및 o4-mini 추론 모델에 베타로 제공되는 Flex 처리는 모델 평가, 데이터 보강, 비동기 워크로드와 같은 우선순위가 낮은 "비프로덕션" 작업을 대상으로 합니다. 이 옵션은 API 비용을 정확히 절반으로 줄입니다. o3의 경우 Flex 처리는 입력 토큰당 5/M,출력토큰당5/M, 출력 토큰당 20/M이며, 표준 가격은 입력 토큰당 10/M,출력토큰당10/M, 출력 토큰당 40/M입니다. o4-mini의 경우 Flex는 가격을 입력 토큰당 0.55/M,출력토큰당0.55/M, 출력 토큰당 2.20/M으로 낮춥니다. 이는 기존의 입력 토큰당 1.10/M,출력토큰당1.10/M, 출력 토큰당 4.40/M에서 크게 할인된 가격입니다.
『무역 전쟁 격화 속 Hence, 기업의 위험 관리를 돕는 AI '어드바이저' 출시』
출처 웹사이트: TechCrunch
링크: https://techcrunch.com/2025/04/17/as-the-trade-war-escalates-hence-launches-an-ai-advisor-to-help-companies-manage-risk/
요약: 런던 기반 스타트업 Hence AI가 'Hence Global'이라는 새로운 소프트웨어 제품을 출시했습니다. 이 제품은 AI를 활용하여 조직이 지정학적 및 비즈니스 위험을 모니터링하고 관리할 수 있도록 돕습니다. Hence Global은 기업이 위험을 추적하고 그 위험을 완화하기 위한 조치에 대해 조언하는 한편, 컨설팅 및 법률 회사와 같은 서비스 제공업체가 고객을 위한 의미 있는 세계 분석을 생성하는 데 도움을 줍니다. 기본 제품은 연간 1,500달러로 일반적인 컨설턴트보다 훨씬 저렴합니다. Hence Global은 Palantir의 Foundry 및 인공지능 플랫폼을 기반으로 구축되었으며, 고객의 특정 요구 사항과 산업에 따라 관련 정보를 이해, 요약 및 분석하기 위해 다양한 AI 모델을 혼합합니다.
『구글의 최신 AI 모델 보고서, 핵심 안전 세부 정보 부족하다고 전문가들 지적』
출처 웹사이트: TechCrunch
링크: https://techcrunch.com/2025/04/17/googles-latest-ai-model-report-lacks-key-safety-details-experts-say/
요약: 구글이 가장 강력한 AI 모델인 Gemini 2.5 Pro를 출시한 지 몇 주 후, 내부 안전 평가 결과를 보여주는 기술 보고서를 발표했습니다. 그러나 전문가들은 이 보고서가 세부 정보가 부족하여 모델이 어떤 위험을 초래할 수 있는지 판단하기 어렵다고 지적합니다. 보고서에는 구글이 작년에 도입한 '프론티어 안전 프레임워크(FSF)'에 대한 언급이 없으며, 내용이 매우 부실하고 모델이 이미 공개된 후 몇 주가 지나서야 발표되었습니다. 전문가들은 구글이 시기적절한 보완 안전 평가를 제공하겠다는 약속을 지킬 것인지 의문을 제기하고 있습니다. 또한 구글은 지난주 발표한 더 작고 효율적인 모델인 Gemini 2.5 Flash에 대한 보고서도 아직 제공하지 않았습니다.
'AI > AI 뉴스' 카테고리의 다른 글
Consensys, Solana, Uniswap은 트럼프 취임식에 2억 3,900만 달러를 기부한 회사 중 하나 (1) | 2025.04.22 |
---|---|
2025년 4월 22일 AI 뉴스 (0) | 2025.04.22 |
이번 주 주목해야 할 주요 암호화폐: Mantra, Memecoin, Pi Network (2) | 2025.04.21 |