Local Coding

在本地设备上运行多个开源代码模型,实现代码生成与审查。

已扫描
适合谁
开发者团队、注重数据安全的独立开发者
不适合谁
无本地计算资源的用户、希望免配置一键使用的初学者
国内可用性
需网络配置。可能需要网络配置或第三方服务可访问。
安装难度
中等(★★☆)。基于终端操作、依赖、API Key 和本地环境要求的初步判断。

安装与下载

openclaw skills install @twinsgeeks/local-coding

Skill 说明

命令、参数、文件名以原文为准

本地编码助手 — 在您的设备集群中运行最佳开源代码模型

在您自己的硬件上运行最优秀的开源代码模型。DeepSeek-Coder、Codestral、StarCoder 和 Qwen-Coder 模型根据需求智能分配至您的各台设备,集群会自动为每次代码生成请求选择最优的计算节点。

您的代码始终保留在本地网络中。无需 GitHub Copilot 订阅,也无云 API 费用。

可用的代码模型

模型参数量Ollama 名称优势
Codestral22Bcodestral支持 80+ 种语言,擅长补全中间代码,Mistral 的代码专用模型
DeepSeek-Coder-V2236B MoE(激活部分约 21B)deepseek-coder-v2在代码任务上的表现可媲美 GPT-4 Turbo
DeepSeek-Coder6.7B, 33Bdeepseek-coder:33b专为代码设计(87% 训练数据来自代码)
Qwen2.5-Coder7B, 32Bqwen2.5-coder:32b强大的多语言代码生成能力
StarCoder23B, 7B, 15Bstarcoder2:15b基于 The Stack v2 训练,支持 600+ 种语言
CodeGemma7BcodegemmaGoogle 推出的代码专注型 Gemma 变体

快速开始

pip install ollama-herd    # PyPI: https://pypi.org/project/ollama-herd/
herd                       # 启动路由服务(端口 11435)
herd-node                  # 在每台设备上运行 —— 自动发现路由服务

安装过程中不会下载任何模型。所有模型拉取均需用户确认。

代码生成

编写新代码

from openai import OpenAI

client = OpenAI(base_url="http://localhost:11435/v1", api_key="not-needed")

response = client.chat.completions.create(
    model="codestral",
    messages=[{"role": "user", "content": "用 Python 编写一个支持 TTL 的线程安全 LRU 缓存"}],
)
print(response.choices[0].message.content)

代码审查

curl http://localhost:11435/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-coder-v2:16b",
    "messages": [{"role": "user", "content": "检查以下代码中的潜在错误和安全问题:\n\n```python\ndef process_payment(amount, card_number):\n    ...\n```"}]
  }'

重构代码

curl http://localhost:11435/api/chat -d '{
  "model": "qwen2.5-coder:32b",
  "messages": [{"role": "user", "content": "将这段代码重构为使用 async/await:..."}],
  "stream": false
}'

兼容您的开发工具

该集群在 http://localhost:11435/v1 提供兼容 OpenAI 的 API 接口,可对接任意编码工具:

工具配置方式
Aideraider --openai-api-base http://localhost:11435/v1 --model codestral
Continue.dev在 VS Code 设置中将 API 基地址设为 http://localhost:11435/v1
Cline设置提供者为 OpenAI 兼容,基地址为 http://localhost:11435/v1
Open WebUI将 Ollama 地址设为 http://localhost:11435
LangChainChatOpenAI(base_url="http://localhost:11435/v1", model="codestral")

根据内存选择合适的模型

跨平台支持:以下为示例配置。只要内存相当,任何设备(Mac、Linux、Windows)均可使用。

设备内存推荐代码模型
MacBook Air(8GB)8GBstarcoder2:3bdeepseek-coder:6.7b
Mac Mini(16GB)16GBcodestralstarcoder2:15b
Mac Mini(32GB)32GBqwen2.5-coder:32bdeepseek-coder:33b
Mac Studio(128GB)128GBdeepseek-coder-v2 —— 前沿代码质量

查看当前运行状态

# 查看已加载到内存中的模型
curl -s http://localhost:11435/api/ps | python3 -m json.tool

# 查看所有可用模型
curl -s http://localhost:11435/api/tags | python3 -m json.tool

# 查看最近的代码请求记录
curl -s "http://localhost:11435/dashboard/api/traces?limit=5" | python3 -m json.tool

集群还支持的功能

通用大模型

Llama 3.3、Qwen 3.5、DeepSeek-R1、Mistral Large —— 通过同一接口处理非代码类任务。

图像生成

curl http://localhost:11435/api/generate-image \
  -d '{"model": "z-image-turbo", "prompt": "开发者工作区插图", "width": 512, "height": 512}'

语音转文字

curl http://localhost:11435/api/transcribe -F "file=@standup.wav" -F "model=qwen3-asr"

完整文档

  • [代理设置指南](https://github.com/geeks-accelerator/ollama-herd/blob/main/docs/guides/agent-setup-guide.md) —— 包含全部 4 类模型的配置说明
  • [API 参考文档](https://github.com/geeks-accelerator/ollama-herd/blob/main/docs/api-reference.md) —— 所有接口详细说明

安全防护机制

  • 模型下载需用户明确确认 —— 代码模型大小从 2GB 到 130GB 不等,每次拉取必须手动确认。
  • 模型删除需用户明确确认
  • 请勿删除或修改 ~/.fleet-manager/ 目录下的文件。
  • 所有模型均不会自动下载 —— 拉取操作必须由用户主动发起或显式同意。
  • 您的代码始终本地化 —— 无论提示词还是生成内容,均不会离开您的本地网络。
T
@twinsgeeks

已收录 1 个 Skill

相关推荐