Ollama 속도 높이는 방법 – 애플 실리콘 맥에서 3배 빠르게 AI 돌리는 꿀팁
맥에서 로컬 AI 모델을 직접 실행하는 사용자라면, 매번 느려지는 속도 때문에 답답함을 느꼈을 겁니다. 특히 모델 규모가 커질수록 GPU 메모리를 잡아먹는 속도가 감당하기 어려울 때가 많죠. 최근 공개된 Ollama 0.19 버전은 이런 문제를 해결하기 위해 애플의 자체 프레임워크를 전격 도입했습니다. Table of Contents Toggle Ollama가 MLX 프레임워크를 선택한 이유 어떻게 더 빨라졌을까? 왜 32GB 메모리가 … Read more