跳至主要內容
Nlog
Blog Home
主要功能与配置演示
博客
ai-daily
250821
250825
250826
250827
250828
ai-impls
yolov9
ai-weekly
001
002
003
004
005
006
007
008
009
010
011
012
013
014
015
016
017
018
019
020
021
022
023
024
025
026
027
028
029
030
031
032
033
034
035
036
037
038
039
040
041
042
043
044
045
046
047
048
049
050
051
052
053
X01
dairys
250222
250223
hf-weekly
001
002
003
004
005
006
007
008
009
010
ielts
simon-task1
simon-task2
papers
3steps-paper-reading
alexnet
bagel
blip-3o
colorizediffusion
comfyui-r1
dgpst
echo-4o
ecomimic-v3
flux-kontext
framepack
hunyuancustom
icedit
ming-omni
nhr
omniconsistency
omnigen2
ovis-u1
pixnerd
qr-lora
qwen-image
reptext
resnet
sdo
show-o2
transformer
vlv
prompts
ai-daily.prompt
ai-weekly.prompt
cover.prompt
fetch-tutorials.prompt
hf-weekly.prompt
image-extract.prompt
papers.prompt
translate.prompt
repos
comfy-mind
reprints
ai-art-gtc-paris-2025
ai-art-newsletter-jan-25
announcing-illustrious-text‑enhancer-tag-booster-and-mood-enhancer
crody's-model-merge-guide
experiments-with-mcp-using-github-copilot
explaining-tokens-the-language-and-currency-of-ai-nvidia-blog
flux-1-kontext
flux-1-krea-dev
flux-kontext-optimization
flux-qlora
generate-consistent-characters
generative-ai-powered-design
gradio-vton-mcp
how-and-when-to-build-multi-agent-systems
illustrious-lu-v0.03
illustrious-xl-3.0-3.5-vpred-2048-resolution-and-natural-language
illustrious-xl-v2.0-the-best-training-base-model-in-1536-age
image-recognition
introducing-gpt-5
introduction-of-prompts-ai-illustration-generation-camera-angle-composition-facial-expression
mcp-flash-in-the-pan-or-future-standard
niji-lesson-1-fundamentals-of-measurement-and-abstraction-the-theory-of-how-to-draw-everything
niji-lesson-2-the-terminator-line
niji-study-1-measuring-with-your-eyes
niji-study-2-notan
niji-video
original-character-lora-sdxl-character-training
qwen3-next-gen-ai-with-hybrid-thinking-and-multilingual-mastery-2025-overview
solving-the-inference-problem-for-open-source-ai-projects-with-github-models
step-by-step-visual-introduction-to-diffusion-models
sci
conda
templates
ai-daily
ai-weekly
hf-weekly
papers
repos
thoughts
platform-operation-thoughts-after-comfycon
tutorials
qwen-code
web
vue-1
workflows
English
简体中文
Papers
neverbiasu
小于 1 分钟
目录
【论文精读】AlexNet:ImageNet Classification with Deep Convolutional Neural Networks
【论文精读】BAGEL: 统一多模态预训练中的涌现属性 (Emerging Properties in Unified Multimodal Pretraining)
【论文精读】BLIP3-o:完全开源的统一多模态模型家族
【论文精读】ColorizeDiffusion:基于参考图像和文本的可调整草图上色方法
【论文精读】ComfyUI-R1:探索用于工作流生成的推理模型
【论文精读】DGPST:精通百变风格的通用肖像画师
【论文精读】Echo-4o:用GPT-4o合成图像强化生成能力
【论文精读】EchoMimicV3:1.3B参数,统一多模态多任务人类动画
【论文精读】FLUX.1 Kontext:统一图像生成与编辑的流匹配模型
【论文精读】FramePack:在下一帧预测视频生成模型中打包输入帧上下文
【论文精读】HunyuanCustom:多模态驱动的定制视频生成架构
【论文精读】ICEdit:In-Context Edit——大规模扩散Transformer的指令图像编辑新范式
【论文精读】Ming-Omni: 统一的多模态感知与生成模型
【论文精读】NoHumansRequired:高质量图像编辑的自主三元组挖掘
【论文精读】OmniConsistency:从成对风格化数据中学习与风格无关的一致性
【论文精读】OmniGen2:探索先进多模态生成(OmniGen2: Advancing Unified Multimodal Generation)
【论文精读】Ovis-U1:统一多模态理解、生成与编辑的3B模型
【论文精读】PixNerd:像素神经场扩散
【论文精读】QR-LoRA:基于QR分解的高效解耦微调
【论文精读】Qwen-Image:原生文本渲染与一致性编辑的生成基础模型
【论文精读】RepText:通过复制实现视觉文本渲染
【论文精读】ResNet:Deep Residual Learning for Image Recognition
【论文精读】SDO: 用梯度捷径加速扩散采样中的反向传播
【论文精读】Show-o2: 改进的原生统一多模态模型
【论文精读】Transformer:Attention Is All You Need
【论文精读】VLV:视觉-语言-视觉自编码器的可扩展知识蒸馏
【高效科研】李沐与吴恩达推荐的论文三步精读法
上一页
Ielts
下一页
Prompts