
2025년 4월, 구글은 Cloud Next 2025 행사에서 7세대 텐서 프로세싱 유닛(TPU)인 Ironwood를 공개했습니다. 이 새로운 TPU는 대규모 언어 모델(LLM)과 전문가 혼합(MoE) 모델의 추론 작업을 위해 설계된 최초의 TPU로, AI 추론 시대의 도래를 알리는 중요한 이정표입니다. 주요 사양 및 성능연산 성능: 각 TPU 칩은 최대 4,614 TFLOPS(FP8 기준)의 연산 능력을 제공합니다.메모리: 192GB의 고대역폭 메모리(HBM)를 탑재하여, 7.2~7.4TB/s의 메모리 대역폭을 지원합니다.확장성: 최대 9,216개의 칩을 하나의 팟(Pod)으로 구성할 수 있으며, 이를 통해 총 42.5 엑사플롭스(ExaFLOPS)의 연산 성능을 달성합니다.에너지 효율성: 이전 세대 대..