公司内网部署大模型的探索之路

作者:锋行天下日期:2025/12/7

使用场景

公司的办公环境是内网,不和互联网相连(保密单位,别问为啥这样),要更新个项目依赖啥的,很麻烦,要使用U盘来回拷贝文件,这是前提,我现在要在内网环境部署大模型,也是一波三折,以下是我的探索之路

  1. 在外网使用docker 运行 ollama 镜像,由于我本地电脑是mac电脑,服务是linux,因为是要把容器导出为镜像文件拿到内网使用,所以拉取镜像的时候要指定宿主机架构,不然的话,导出的镜像文件在服务器无法运行
1docker pull --flatform=linux/amd64 ollama/ollama:latest
2
1docker run -d --name ollama-test -p 11434:11434 ollama/ollama:latest
2

2. 运行一个ollama容器,然后进入到该容器内部,用ollama指令安装指定大模型

1docker exec -it ollama-test bash
2//这里以deepseek-r1:1.5b 为例子
3ollama run deepseek-r1:1.5b
4

3. 这时候是可以在本机使用chatbox链接使用容器内的大模型的,具体步骤不在这里细说

22.png4. 把运行中的容器提交为本地镜像,这样你的镜像里就带上了你安装的大模型

1docker commit xxx yyy:latest
2// xxx 为容器名或者id yyy:latest 是你自定义的镜像名和版本号
3

5. 把本地自定义镜像导出为镜像文件

1docker save -o <filename>.tar <image_name>
2

6. 把镜像文件拷到内网,使用docker加载你的镜像文件,前提条件是内网必须有docker环境

1docker load -i /path/to/your/image.tar
2

到此为止,你的内网就有携带大模型的ollama镜像了,你把容器运行起来,你再把chatbox安装包也拷到内网,就可以愉快的玩耍了

如何新增其他大模型到内网

现在的大模型有很多,功能各不相同,你可以多安装几个大模型,再导出镜像文件,拿到内网使用,安装了大模型的镜像文件会很大,我也就安装了上图的几个小模型,文件的体积就已经达到了30G以上,但是这不失为一种笨方法。大力出奇迹,但是作为一个程序员,我们总是要探索更省时省力的办法,以下是我个人探索的方法。

  1. 重新运行一个空白的ollama容器,把你要新增的大模型安装上
  2. 使用docker cp指令把容器内的模型文件拷贝出来,拿到内网,放到指定的位置即可,主要有两类文件需要拷贝,模型配置文件和模型数据文件,这两类文件的目录分别是
1// 模型数据文件在 /root/.ollama/models/blobs
2docker cp bff31133b939:/root/.ollama/models/blobs/. ./blobs
3// 我这个指令的意思是  容器内的数据文件拷贝到 本机的当前目录的blobs文件夹下,你也可以使用绝对路径
4docker cp bff31133b939:/root/.ollama/models/manifests/registry.ollama.ai/library/. ./
5// 这个指令的意思是把这个模型的配置文件拷贝当当前目录下,你也可以使用绝对路径
6

以下是我拷贝出来的deepseek-r1:8b的配置文件和数据文件截图

333.png

444.png

555.png

  1. 把这两个文件拷贝到内网,放到以前的容器里对应的目录下,这样你内网的容器就新增了你这次导入的模型

疑问:有些老司机看到这里就郁闷了,运行容器时候直接用数据卷功能,把容器内的目录挂载出来,这样就不用进入到容器内拷贝文件了,哈哈哈哈哈 皮裤套棉裤!必定有缘故,我刚开始也是这样想的,但是我试了好多次,运行容器时使用数据卷功能根本就运行不了,大致原因是我用的是mac电脑,是arm64架构,我使用的容器是amd64架构,它两的文件系统不兼容,无法直接使用数据卷功能,到这里有小伙伴找到更好的办法了一定要教教我,感谢!


公司内网部署大模型的探索之路》 是转载文章,点击查看原文


相关推荐


Python高性能数据库操作实战:异步IO与多线程结合代码解析
2501_941800882025/11/28

在高并发数据库访问和大数据处理场景中,高性能数据库操作系统至关重要。Python结合异步IO和多线程,可实现快速、稳定的数据库操作平台。本文结合代码示例,讲解Python数据库操作实战方法。 一、基础数据库操作 使用sqlite3进行简单操作: import sqlite3 conn = sqlite3.connect('example.db') c = conn.cursor() c.execute('CREATE TABLE IF NOT EXISTS users (id INTEG


人工智能入门概念介绍
Shawn_Shawn2025/12/15

最近公司正在推荐Ai相关项目,目前主要是大模型相关的应用层面开发,但自己还是希望能够基础入手,全方位了解一下机器学习,深度学习,强化学习,自然语言,大模型等Ai相关的知识点,仅了解相关概念,不去深入了解算法实现。本文主要介绍一下机器学习的基本概念。 什么是机器学习 引用周志华带佬的机器学习一书提到的案例,我们在生活中挑选西瓜的时候,经常会假嘛若鬼地敲一下西瓜,听一听声音,如果发出 “嘭嘭” 的闷声,说明西瓜成熟度好,果肉饱满。若发出 “当当” 的清脆声,可能西瓜还未成熟;若发出 “噗噗” 声,则


Gradle 基础篇之基础知识的介绍和使用
一线大码2025/12/23

1. 项目结构 目录介绍: build.gradle:项目编译时要读取的配置文件,build.gradle有两个,一个是全局的,一个是在模块里面。全局的build.gradle主要设置的是声明仓库源,gradle的版本号说明等。 gradlew:linux下的gradle环境脚本。可以执行gradle指令,比如./greadle build。 gradlew.bat:windows下的gradle环境脚本。可以执行gradle指令。 settings.gradle:包含一些必要设置,例如,任


机器学习数据集完全指南:从公开资源到Sklearn实战
郝学胜-神的一滴2026/1/1

机器学习数据集完全指南:从公开资源到Sklearn实战 1. 引言:为什么数据集如此重要?2. 机器学习公开数据集大全2.1 综合型数据集平台2.2 领域特定数据集 3. Sklearn内置数据集详解3.1 小型玩具数据集3.2 大型真实世界数据集3.3 完整列表 4. Sklearn数据集加载实战4.1 基本加载方法4.2 数据集对象结构4.3 转换为Pandas DataFrame 5. Sklearn数据集处理API大全5.1 数据分割5.2 特征缩放5.3 特征编码5.4


Incremark Solid 版本上线:Vue/React/Svelte/Solid 四大框架,统一体验
king王一帅2026/1/10

Incremark 现已支持 Solid,至此完成了对 Vue、React、Svelte、Solid 四大主流前端框架的全面覆盖。 为什么要做框架无关 市面上大多数 Markdown 渲染库都是针对特定框架开发的。这带来几个问题: 重复造轮子:每个框架社区都在独立实现相似的功能 能力不一致:不同框架的实现质量参差不齐 团队切换成本:换框架意味着重新学习新的 API Incremark 采用不同的思路:核心逻辑与 UI 框架完全解耦。 @incremark/core 负责所有解析、转换、增量更


【我与2025】裁员、旅游、找工作、媳妇没跑
修己xj2026/1/18

现在是2026年1月下旬。以往的年终总结总被搁置,今年却有些不同——家里添了新成员,自己的心态也悄然变化。于是决定写下这些文字,既是回顾我的2025,也是一次认真的复盘。 裁员 2021年6月,我加入上一家公司,一待就是四年。2025年收到的第一份“礼物”,竟是公司的裁员通知。我负责的是运营业务系统,因为常有线上问题需要处理,所以即便下班后、节假日也离不开电脑。几年来,我几乎没出省旅行过,每次回家都随身带着电脑,随时待命。 刚入职时,公司正处于扩张期,盈利状况很好。没过多久,就搬进了自购的整层


机器学习特征选择:深入理解移除低方差特征与sklearn的VarianceThreshold
郝学胜-神的一滴2026/1/26

机器学习特征选择:深入理解移除低方差特征与sklearn的VarianceThreshold 引言:为什么特征选择如此重要?一、低方差特征为什么需要移除?1.1 低方差特征的问题1.2 低方差特征的典型场景1.3 数学表达 二、sklearn的VarianceThreshold详解2.1 基本用法2.2 关键参数说明2.3 重要属性 三、实战案例:电商用户行为分析3.1 数据集描述3.2 应用VarianceThreshold3.3 结果分析 四、进阶技巧与注意事项4.1 数据标准

首页编辑器站点地图

本站内容在 CC BY-SA 4.0 协议下发布

Copyright © 2026 XYZ博客