计算机视觉领域的GPT-3，分割一切只是起点 - 多模态吧 - RAT

计算机视觉领域的GPT-3，分割一切只是起点

吧务

level 10

命起涟漪💦 楼主

它的出现被称为计算机视觉领域的GPT-3:Segment Anything Model (SAM)：zero-shot“分割一切”的SAM可提示(promptable)分割系统，可通过提示指定要分割的内容，无需额外训练。表面上是一个分割模型，但用上它会有许多不可思议的应用。
比如Grounded-Segment-Anything，可实现自动检测、分割、生成图像与文本，效果图
镇楼 [吐舌]

[吐舌]

2023年04月14日 15点04分 1

吧务

level 10

命起涟漪💦 楼主

Grounded-Segment-Anything，可实现自动检测、分割、生成图像与文本。基于 Grounding DINO 和 Meta AI Segment Anything 库构建。 GitHub：网页链接镇楼图就是基于此产生的效果，给🐔哥换套新皮肤 [滑稽]

[滑稽]

。除此之外可以通过提示词进行识别和p图，就像给gpt发号施令一样。图一二展示了通过提示词进行识别的能力(被框起来的目标)，图三展示了通过提示词把狗坐的椅子给换了

2023年04月14日 15点04分 2

吧务

level 10

命起涟漪💦 楼主

基于Segment Anything的stable diffusion插件，AI绘画抠图更简单了，蒙版重绘更效率

2023年04月14日 15点04分 3

吧务

level 10

命起涟漪💦 楼主

AnyLabeling：Segment Anything + YOLO 图像标注工具，利用Segment Anything强大的zero-shot分割能力帮助进行yolo数据集的标注，GitHub: 网页链接

2023年04月14日 17点04分 4

吧务

level 10

命起涟漪💦 楼主

SAM + OCR + Stable Diffusion 对文本基于提示词自动检测、识别和分割以及一些下游任务，如把图片中的文字文本去除或补全，或者更多操作
GitHub: 网页链接

2023年04月14日 17点04分 5

吧务

level 10

命起涟漪💦 楼主

Segment Anything相关资源大列表(github)，整合了Segment Anything的各种资源
网页链接

2023年04月15日 10点04分 6

吧务

level 10

命起涟漪💦 楼主

Count Anything：Segment Anything + CLIP 实现的零样本计数
GitHub: 网页链接

2023年04月17日 10点04分 7

1