차이

문서의 선택한 두 판 사이의 차이를 보여줍니다.

차이 보기로 링크

tech:llama.cpp [2026/03/02 10:01] – 만듦 192.168.0.1tech:llama.cpp [2026/03/02 10:07] (현재) 192.168.0.1
줄 15: 줄 15:
 **-t N, --threads N **-t N, --threads N
 ** **
 +
 이것도 매우 중요한 옵션입니다. 위의 ngl 옵션과 함께 퍼포먼스 수준을 결정한다고 해도 과언이 아니죠. 바로 여러분의 CPU를 풀로 활용하기 위한 옵션입니다. 적절한 스레드 숫자를 찾아줘야 CPU 가동율 100%를 달성하여 최적화 할 수 있는데요. 이 숫자는 보통 PC의 물리코어 숫자와 동일하게 맞춰주면 된다고 합니다. 하지만 환경차이로 인해서 다른 결과가 나올 수도 있으니, 숫자를 조금씩 더하거나 빼면서 CPU 가동율을 모니터링 해서 자신에게 가장 적합한 값을 찾아내는 게 베스트일 거예요.  이것도 매우 중요한 옵션입니다. 위의 ngl 옵션과 함께 퍼포먼스 수준을 결정한다고 해도 과언이 아니죠. 바로 여러분의 CPU를 풀로 활용하기 위한 옵션입니다. 적절한 스레드 숫자를 찾아줘야 CPU 가동율 100%를 달성하여 최적화 할 수 있는데요. 이 숫자는 보통 PC의 물리코어 숫자와 동일하게 맞춰주면 된다고 합니다. 하지만 환경차이로 인해서 다른 결과가 나올 수도 있으니, 숫자를 조금씩 더하거나 빼면서 CPU 가동율을 모니터링 해서 자신에게 가장 적합한 값을 찾아내는 게 베스트일 거예요. 
 +
 +  .\llama-cli.exe   -m Qwen3.5-35B-A3B-UD-MXFP4_MOE.gguf   -ngl 99 --n-cpu-moe 12   --flash-attn on   -p ""
 +  [ Prompt: 38.3 t/s | Generation: 8.1 t/s ]

CC Attribution-Noncommercial-Share Alike 4.0 International 별도로 명시하지 않을 경우, 이 페이지의 내용은 다음 라이선스에 따라 사용할 수 있습니다: CC Attribution-Noncommercial-Share Alike 4.0 International
tech/llama.cpp.1772445700.txt.gz · 마지막으로 수정됨 저자 192.168.0.1 · 현재 잠겨진 사용자 216.73.216.63