谷歌 Gemini CLI 重磅发布!手把手教你用命令行玩转 AI 多模态开发

谷歌 Gemini CLI 重磅发布!手把手教你用命令行玩转 AI 多模态开发

技术教程gslnedu2025-06-29 21:29:245A+A-

1.前言

Gemini CLI 是一个用于与 Google Gemini 大型语言模型交互的命令行工具,它为开发者、研究人员以及任何需要通过命令行与 Gemini 模型交互的用户提供了强大而灵活的功能。Gemini 是 Google DeepMind 开发的一系列多模态人工智能模型,具备语言、音频、代码和视频理解能力,能够处理多种任务,包括文本生成、多模态对话、代码生成等。

就在昨天2025年6月25日,科技圈又迎来了一个足以震撼开发者群体的大事件。

谷歌正式推出了Gemini CLI ,将 Gemini 大模型的强大能力直接融入到开发者日常离不开的命令行界面之中。

登录个人谷歌账号,即可享受每分钟 60 次、每天 1000 次的模型请求机会,还能解锁 100 万 token 的超大上下文窗口

一张图我们看它的特点:

下面我们就手把手教大家如何使用。

2.安装前置

检查 Node.js 版本

首先,打开终端(Windows 用户请使用 PowerShell 或 Command Prompt)并运行以下命令检查是否已安装 Node.js:

node --version

如果显示的版本号低于 18.0.0 或显示"command not found",您需要安装或更新 Node.js

安装 Node.js(如果需要)

Windows 用户:

  1. 访问 Node.js 官网
  2. 下载 LTS 版本(推荐)
  3. 运行安装程序,按照提示完成安装
  4. 重启终端并再次运行 node --version 确认安装成功

我电脑是windows 就拿windows来介绍。

验证 npm 安装

npm 通常会随 Node.js 一起安装。运行以下命令确认:

npm --version

3.安装步骤

我们就拿官方的快速安装给大家介绍。

安装CLI

运行 CLI:在终端中执行以下命令:

npx https://github.com/google-gemini/gemini-cli

执行完成后我们看到下面的画面

授权

接下下来我们会看到有google 登录授权

浏览器会弹出授权登录

授权完成后我们就可以进入聊天对话界面了

简单验证

简单输入聊天信息

看到上面的画面我们的 google gemini-cli 就可以使用了。哈哈

补充说明:

目前我们需要一些魔法来实现网络访问,可以把网络切换到美国的节点,其他节点我这里没有详细测试。可以考虑把网络切换到全局模式。当然你也可以通过网络代理设置,这里不做详细展开。

4.功能介绍

联网搜索

请帮查询一下2025年6月26日最新科技新闻

文件读取

我们先把需要读取的文件复制到C:\Users\wwwzh 文件夹下

我这有一份低空经济产业链发展研究报告,我让它帮我分析总结一下。

网页版小游戏

接下来我们让他给我生成一个网页HTML 的小游戏

你的任务是使用 HTML、CSS 和 JavaScript 创建一个简单的网页版“打地鼠”游戏。以下是游戏的详细规则:
  1. 游戏界面是一个 4x4 的网格。
  2. 每隔 1 - 2 秒,会有一只“地鼠”随机出现在一个格子里。
  3. 玩家点击“地鼠”即可得分,分数需要实时显示。
  4. 游戏包含一个“开始/重新开始”按钮和一个 30 秒的倒计时。

  请将实现上述功能的所有代码打包到一个 index.html 文件中。在编写代码时,要确保结构清晰,逻辑正确,并且代码具有良好的可读性。

  请在标签内写下完整的 index.html 文件代码。

生成的代码

我们使用浏览器打开看看

长得有点丑,不过确实一次性搞定。

生成媒体与合成能力

它通用可以通过MCP 和Imagen 3 - 用于图像生成和编辑、 Veo 2 - 用于视频创作、Chirp 3 HD - 用于音频合成、Lyria - 用于音乐生成

AVTool - 用于音频/视频合成与编辑等媒体功能。不过这里需要安装vertex-ai-creative-studio等

详细功能可以参考
https://github.com/GoogleCloudPlatform/vertex-ai-creative-studio/tree/main/experiments/mcp-genmedia 文档

这里我们就不做详细展开了

5.总结

今天主要带大家了解并实现了使用谷歌 Gemini CLI 的方案。此命令行工具旨在将 Google Gemini 大模型的强大能力融入开发者日常使用的命令行界面,为开发者、研究人员等提供了强大而灵活的交互方式,能够处理文本生成、多模态对话、代码生成等多种任务。

我们详细介绍了安装前置条件,包括检查和安装 Node.js 以及验证 npm 安装;接着阐述了安装步骤,如运行 CLI 和完成授权登录;还展示了其丰富的功能,如联网搜索、文件读取、网页版小游戏代码生成以及生成媒体与合成能力等。该方案不仅解决了以往与大模型交互不便的问题,还借助其多模态能力拓展了应用场景。

感兴趣的小伙伴可以按照本文步骤去尝试安装和使用谷歌 Gemini CLI。今天的分享就到这里结束了,我们下一篇文章见。

点击这里复制本文地址 以上内容由朽木教程网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

朽木教程网 © All Rights Reserved.  蜀ICP备2024111239号-8