谷歌 Gemini CLI 重磅发布!手把手教你用命令行玩转 AI 多模态开发
1.前言
Gemini CLI 是一个用于与 Google Gemini 大型语言模型交互的命令行工具,它为开发者、研究人员以及任何需要通过命令行与 Gemini 模型交互的用户提供了强大而灵活的功能。Gemini 是 Google DeepMind 开发的一系列多模态人工智能模型,具备语言、音频、代码和视频理解能力,能够处理多种任务,包括文本生成、多模态对话、代码生成等。
就在昨天2025年6月25日,科技圈又迎来了一个足以震撼开发者群体的大事件。
谷歌正式推出了Gemini CLI ,将 Gemini 大模型的强大能力直接融入到开发者日常离不开的命令行界面之中。
登录个人谷歌账号,即可享受每分钟 60 次、每天 1000 次的模型请求机会,还能解锁 100 万 token 的超大上下文窗口。
一张图我们看它的特点:
下面我们就手把手教大家如何使用。
2.安装前置
检查 Node.js 版本
首先,打开终端(Windows 用户请使用 PowerShell 或 Command Prompt)并运行以下命令检查是否已安装 Node.js:
node --version
如果显示的版本号低于 18.0.0 或显示"command not found",您需要安装或更新 Node.js
安装 Node.js(如果需要)
Windows 用户:
- 访问 Node.js 官网
- 下载 LTS 版本(推荐)
- 运行安装程序,按照提示完成安装
- 重启终端并再次运行 node --version 确认安装成功
我电脑是windows 就拿windows来介绍。
验证 npm 安装
npm 通常会随 Node.js 一起安装。运行以下命令确认:
npm --version
3.安装步骤
我们就拿官方的快速安装给大家介绍。
安装CLI
运行 CLI:在终端中执行以下命令:
npx https://github.com/google-gemini/gemini-cli
执行完成后我们看到下面的画面
授权
接下下来我们会看到有google 登录授权
浏览器会弹出授权登录
授权完成后我们就可以进入聊天对话界面了
简单验证
简单输入聊天信息
看到上面的画面我们的 google gemini-cli 就可以使用了。哈哈
补充说明:
目前我们需要一些魔法来实现网络访问,可以把网络切换到美国的节点,其他节点我这里没有详细测试。可以考虑把网络切换到全局模式。当然你也可以通过网络代理设置,这里不做详细展开。
4.功能介绍
联网搜索
请帮查询一下2025年6月26日最新科技新闻
文件读取
我们先把需要读取的文件复制到C:\Users\wwwzh 文件夹下
我这有一份低空经济产业链发展研究报告,我让它帮我分析总结一下。
网页版小游戏
接下来我们让他给我生成一个网页HTML 的小游戏
你的任务是使用 HTML、CSS 和 JavaScript 创建一个简单的网页版“打地鼠”游戏。以下是游戏的详细规则:
1. 游戏界面是一个 4x4 的网格。
2. 每隔 1 - 2 秒,会有一只“地鼠”随机出现在一个格子里。
3. 玩家点击“地鼠”即可得分,分数需要实时显示。
4. 游戏包含一个“开始/重新开始”按钮和一个 30 秒的倒计时。
请将实现上述功能的所有代码打包到一个 index.html 文件中。在编写代码时,要确保结构清晰,逻辑正确,并且代码具有良好的可读性。
请在标签内写下完整的 index.html 文件代码。
生成的代码
我们使用浏览器打开看看
长得有点丑,不过确实一次性搞定。
生成媒体与合成能力
它通用可以通过MCP 和Imagen 3 - 用于图像生成和编辑、 Veo 2 - 用于视频创作、Chirp 3 HD - 用于音频合成、Lyria - 用于音乐生成
AVTool - 用于音频/视频合成与编辑等媒体功能。不过这里需要安装vertex-ai-creative-studio等
详细功能可以参考
https://github.com/GoogleCloudPlatform/vertex-ai-creative-studio/tree/main/experiments/mcp-genmedia 文档
这里我们就不做详细展开了
5.总结
今天主要带大家了解并实现了使用谷歌 Gemini CLI 的方案。此命令行工具旨在将 Google Gemini 大模型的强大能力融入开发者日常使用的命令行界面,为开发者、研究人员等提供了强大而灵活的交互方式,能够处理文本生成、多模态对话、代码生成等多种任务。
我们详细介绍了安装前置条件,包括检查和安装 Node.js 以及验证 npm 安装;接着阐述了安装步骤,如运行 CLI 和完成授权登录;还展示了其丰富的功能,如联网搜索、文件读取、网页版小游戏代码生成以及生成媒体与合成能力等。该方案不仅解决了以往与大模型交互不便的问题,还借助其多模态能力拓展了应用场景。
感兴趣的小伙伴可以按照本文步骤去尝试安装和使用谷歌 Gemini CLI。今天的分享就到这里结束了,我们下一篇文章见。
相关文章
- 太秀了!Excel批量生成条形码和二维码,一个公式就能解决
- Grid.js - 跨框架的前端表格插件
- Deepseek与Excel才是绝配,分享7个技巧,让你秒变办公达人!
- 用ASP生成Excel数据三种方法
- VBA技术资料MF327:将Excel表格转换为HTML
- 一分钟用 MCP 上线一个 贪吃蛇 小游戏(CodeBuddy版)
- 谷歌 Gemini CLI 重磅发布!手把手教你用命令行玩转 AI 多模态开发
- 腾讯元宝+DeepSeek-v3-0324自动编程,2分钟生成经典贪吃蛇游戏!
- 手绘风格的解谜冒险类游戏——虚构世界(Figment)
- Ai 编辑器 Cursor 零基础教程:推箱子小游戏实战演练