구글, TurboQuant 알고리즘 제품군 공개 — AI 메모리 6배 압축·속도 8배 향상
Google Research가 훈련이 필요 없는 AI 메모리 압축 알고리즘 제품군 TurboQuant를 공개했습니다. KV 캐시 메모리 사용량을 6배 줄이고 어텐션 연산을 8배 가속화해 기업의 AI 추론 비용을 50% 이상 절감할 가능성이 있습니다.
Google Research가 훈련이 필요 없는 AI 메모리 압축 알고리즘 제품군 TurboQuant를 공개했습니다. KV 캐시 메모리 사용량을 6배 줄이고 어텐션 연산을 8배 가속화해 기업의 AI 추론 비용을 50% 이상 절감할 가능성이 있습니다.