Index
模型推理引擎
像 Xinference、vLLM、Ollama 这样的推理引擎,它们本身不改变模型的权重(Weights),也就是说它们不能让一个笨模型变聪明。但是,它们提供了控制模型行为的关键杠杆
“OpenAI 风格”本质上是 高质量模型权重 (70%) + 精心设计的 System Prompt (20%) + 合理的参数配置 (10%) 的产物。 没有好模型,引擎再强大也调不出那种风格(巧妇难为无米之炊)。 有好模型但没有正确的 Prompt 配置(引擎层或应用层缺失),模型可能会表现得过于随意或啰嗦,失去那股“味儿”
ffmpeg 音频处理
modelscope
模型下载
pip install modelscope
modelscope download --model openai-mirror/whisper-small --local_dir ./
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cpu
import torch print(torch.version) print(torch.cuda.is_available()) # CPU 机器会返回 False