주요 내용
텐센트는 경쟁이 치열한 인공지능 분야에서 입지를 강화하기 위한 전략적 움직임으로, 프로덕션급 HPC-Ops 라이브러리를 공개했습니다. 이 오픈소스 도구는 대규모 언어 모델(LLM)의 추론 속도를 크게 가속화하여, 텐센트 기술을 중심으로 더 넓은 개발자 생태계를 구축하고 클라우드 서비스의 미래 성장을 주도하는 것을 목표로 합니다.
- 성능 도약: 새로운 HPC-Ops 라이브러리는 실제 시나리오에서 텐센트의 독점 혼원(Hunyuan) 모델의 추론 처리량(분당 쿼리 수)을 30% 증가시켰습니다.
- 경쟁 벤치마크: 구성 요소 수준에서 이 라이브러리는 기존 대안보다 상당한 성능 향상을 보여주며, Attention 연산자는 FlashAttention보다 최대 2.22배 더 빠르게 실행됩니다.
- 생태계 전략: 이 도구를 오픈소싱함으로써 텐센트는 AI 개발자를 유치하고 채택을 유도하여, 장기적인 성장을 위한 클라우드 및 AI 서비스 제품을 강화하는 것을 목표로 합니다.
