网站首页 > 教程文章 正文
开源模型:阿里通义千问
通义,由通义千问更名而来,是阿里云推出的语言模型,于2023年9月13日正式向公众开放。
地址:https://tongyi.aliyun.com/,https://tongyi.aliyun.com/qianwen
2024年6月7日,阿里巴巴正式开源了大模型:Qwen2。Qwen2一共有5种预训练和指令微调模型,包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。
项目地址:https://github.com/QwenLM/Qwen2
Ollama(https://ollama.com/)
Ollama是一个功能强大的开源框架,旨在简化在Docker容器中部署和管理大型语言模型(LLM)的过程。
LLM在人工智能领域代表:“Large Language Model”,即大型语言模型。
Ollama已经支持QWen2,模型页面:https://ollama.com/library/qwen2
Ollama是一个本地运行 LLM 的工具,使用Go语言写的工具,支持:Llama、Gemma、Mistral等大模型,适用于Windows、macOS、Linux 操作系统。
Windows下载,下载完成后:OllamaSetup.exe
下载后直接安装,安装目录为:C:\Users\${user_home}\AppData\Local\Programs\Ollama
默认模型存放路径: C:\Users\${user_home}\.ollama\models
查看版本:ollama -v
使用命令行测试: ollama list
设置环境变量:OLLAMA_MODELS=E:\AppsData\Ollama\Image
命令运行:ollama run qwen2
对话开始:
Ollama可以设置的环境变量:
OLLAMA_HOST:这个变量定义了Ollama监听的网络接口,通过设置OLLAMA_HOST=0.0.0.0,可以让Ollama监听所有可用的网络接口,从而允许外部网络访问。
OLLAMA_MODELS:这个变量指定了模型镜像的存储路径,通过设置OLLAMA_MODELS=F:\Ollama,可以将模型镜像存储在其它盘,避免C盘空间不足的问题。
OLLAMA_KEEP_ALIVE:这个变量控制模型在内存中的存活时间,设置OLLAMA_KEEP_ALIVE=24h可以让模型在内存中保持24小时,提高访问速度。
OLLAMA_PORT:这个变量允许我们更改Ollama的默认端口,设置OLLAMA_PORT=8080可以将服务端口从默认的11434更改为8080。
OLLAMA_NUM_PARALLEL:这个变量决定了Ollama可以同时处理的用户请求数量,设置OLLAMA_NUM_PARALLEL=4可以让Ollama同时处理两个并发请求。
OLLAMA_MAX_LOADED_MODELS:这个变量限制了Ollama可以同时加载的模型数量,设置OLLAMA_MAX_LOADED_MODELS=4可以确保系统资源得到合理分配。
ollama的常用命令:
ollama serve, 启动ollama;
ollama create,从模型文件创建模型;
ollama show,显示模型信息;
ollama run,运行模型;
ollama pull,从注册表中拉取模型;
ollama push,将模型推送到注册表;
ollama list,列出模型;
ollama cp, 复制模型;
ollama rm,删除模型;
ollama help,获取有关任何命令的帮助信息。
API调用:
http://127.0.0.1:11434/api/generate
其他大模型:
ollama run llama2-chinese
猜你喜欢
- 2024-12-06 开源装机工具Ventoy 1.0.90发布:现支持超过1100种ISO镜像
- 2024-12-06 k8s 之镜像仓库
- 2024-12-06 魔哈:Grok国内镜像
- 2024-12-06 35K star!生产环境的Java诊断工具,阿里开源神器
- 2024-12-06 4月8日收集更新:可用谷歌(google)镜像站点代理网站
- 2024-12-06 阿里开源数据同步神器Canal,数据同步再也不发愁了
- 2024-12-06 OpenWrt官方软件源太慢?更换源并测试国内镜像哪家好
- 2024-12-06 开源磁盘镜像和恢复工具Rescuezilla 2.5.1发布!
- 2024-12-06 2个良心的“Windows资源站”,镜像开源纯净!真是相见恨晚
- 最近发表
- 标签列表
-
- location.href (44)
- document.ready (36)
- git checkout -b (34)
- 跃点数 (35)
- 阿里云镜像地址 (33)
- qt qmessagebox (36)
- md5 sha1 (32)
- mybatis plus page (35)
- semaphore 使用详解 (32)
- update from 语句 (32)
- vue @scroll (38)
- 堆栈区别 (33)
- 在线子域名爆破 (32)
- 什么是容器 (33)
- sha1 md5 (33)
- navicat导出数据 (34)
- 阿里云acp考试 (33)
- 阿里云 nacos (34)
- redhat官网下载镜像 (36)
- srs服务器 (33)
- pico开发者 (33)
- https的端口号 (34)
- vscode更改主题 (35)
- 阿里云资源池 (34)
- os.path.join (33)