计算机视觉领域的GPT-3,分割一切只是起点
多模态吧
全部回复
仅看楼主
吧务
level 10
命起涟漪💦
楼主
它的出现被称为计算机视觉领域的GPT-3:Segment Anything Model (SAM):zero-shot“分割一切”的SAM可提示(promptable)分割系统,可通过提示指定要分割的内容,无需额外训练。表面上是一个分割模型,但用上它会有许多不可思议的应用。
比如Grounded-Segment-Anything,可实现自动检测、分割、生成图像与文本,效果图
镇楼
2023年04月14日 15点04分
1
吧务
level 10
命起涟漪💦
楼主
Grounded-Segment-Anything,可实现自动检测、分割、生成图像与文本。 基于 Grounding DINO 和 Meta AI Segment Anything 库构建。 GitHub:
网页链接
镇楼图就是基于此产生的效果,给🐔哥换套新皮肤
。除此之外可以通过提示词进行识别和p图,就像给gpt发号施令一样。图一二展示了通过提示词进行识别的能力(被框起来的目标),图三展示了通过提示词把狗坐的椅子给换了
2023年04月14日 15点04分
2
吧务
level 10
命起涟漪💦
楼主
基于Segment Anything的stable diffusion插件,AI绘画抠图更简单了,蒙版重绘更效率
2023年04月14日 15点04分
3
吧务
level 10
命起涟漪💦
楼主
AnyLabeling:Segment Anything + YOLO 图像标注工具,利用Segment Anything强大的zero-shot分割能力帮助进行yolo数据集的标注,GitHub:
网页链接
2023年04月14日 17点04分
4
吧务
level 10
命起涟漪💦
楼主
SAM + OCR + Stable Diffusion 对文本基于提示词自动检测、识别和分割以及一些下游任务,如把图片中的文字文本去除或补全,或者更多操作
GitHub:
网页链接
2023年04月14日 17点04分
5
吧务
level 10
命起涟漪💦
楼主
Segment Anything相关资源大列表(github),整合了Segment Anything的各种资源
网页链接
2023年04月15日 10点04分
6
吧务
level 10
命起涟漪💦
楼主
Count Anything:Segment Anything + CLIP 实现的零样本计数
GitHub:
网页链接
2023年04月17日 10点04分
7
1