Skip to content

Index

模型推理引擎

像 Xinference、vLLM、Ollama 这样的推理引擎,它们本身不改变模型的权重(Weights),也就是说它们不能让一个笨模型变聪明。但是,它们提供了控制模型行为的关键杠杆

“OpenAI 风格”本质上是 高质量模型权重 (70%) + 精心设计的 System Prompt (20%) + 合理的参数配置 (10%) 的产物。 没有好模型,引擎再强大也调不出那种风格(巧妇难为无米之炊)。 有好模型但没有正确的 Prompt 配置(引擎层或应用层缺失),模型可能会表现得过于随意或啰嗦,失去那股“味儿”

ffmpeg 音频处理

modelscope

模型下载

pip install modelscope
modelscope download --model openai-mirror/whisper-small  --local_dir ./

pip install torch torchaudio --index-url https://download.pytorch.org/whl/cpu

import torch print(torch.version) print(torch.cuda.is_available()) # CPU 机器会返回 False

☁️ 部署建议
如果你打算长期运行项目(博客 / API / 自动化脚本),建议直接用云服务器,会比本地稳定很多。
👉 查看云服务器(新用户优惠)