这一两周最火的新闻就是 GPT-4-vision-preview的发布,可以根据图片进行理解,返回你想要的文本。微软的Azure OpenAI Service也快速跟进,目前在有一些区域已经可以用了。

经过测试,OpenAI 自带的那个gpt-4-vision-preview 居然是免费的,业界良心啊。

既然这么火,那么我编写的自动化脚本库(PowerShell OpenAI SDK)怎么能落后呢?下班后搬了一会儿砖,把这个功能完美地添加进去了。

如果你还不知道这个工具,请参考 https://xizhang.com/openai-powershell/ 这里的介绍,通过下面的命令安装。

636ce659a54560a3d21d9fb281b96d1d.png

请升级到最新的 2.0.0.3 版本

15aeb1efb1cb3d3dca8b51d4451bbac8.png

当前这个新增的命令的帮助文档如下

49ca1ffd400933bf3f52f7fdd1074148.png

代码范例如下

c3972991dca1e4b24687c94f3c103378.png

话不多说了,来看一个具体的例子吧。例如你有如下的一张图片,希望人工智能帮你识别一下,并且告诉你里面都有啥。

8af8deed897be442526ada5dbf853f0c.jpeg

你可以用一句命令来完成。

43e765db680d559593d21ca4f55449ca.png

看起来还不错吧,当然这个只是基本用法,还可以有很多其他变化,等待你的发现了。

请注意,运行这个工具需要你安装PowerShell,不仅可以运行在Windows,也支持Mac,和Linux哦。它的主要优势是用来做自动化,例如批量生成内容,图片等。

我后续抽时间再写点具体的场景案例给大家参考。

Logo

一站式 AI 云服务平台

更多推荐