深入解析DeepSeek V3與R1：揭示先進技術背後的成功秘密

2026-03-24

深入解析DeepSeek V3與R1：揭示先進技術背後的成功秘密

深入解讀DeepSeek V3與R1，揭示以混合專家MoE與FP8訓練的高效密技，讓大規模模型在相對較低成本下迎頭趕上。核心數據：V3約2.8百萬GPU時數、對照Llama3的31百萬，成本約5.6百萬美元；R1結合推理與強化學習，並以知識蒸餾落地至小型模型。文章還分享在本地透過Ollama執行DeepSeek的步驟與風險。

星夜城

2026-03-24

字节跳动豆包最強Dit視頻生成模型PixelDance詳解｜夢AI平台打造高效影片創作新體驗

人工智慧, 技術應用, 視頻創作

本篇以字節跳動豆包PixelDance詳解影片為基底，揭示即夢AI平台的第一手實測。筆者於文生視頻在1280×720、6秒段長試用，實際幀率僅8幀/秒，遠低於runway gen-3 turbo的24幀/秒；補幀與提升方案成為現實考量。官方演示的PixelDance/Seaweed展現高穩定性與分鏡控制，但公測尚未開放，文中亦提供申請與評估要點，助你把握新模型的期待與現實差距，並在描述中找到申請連結。

星夜城

2026-03-24

深度探索人工智慧的未來：DeepSeek、OpenAI、NVIDIA與台積電如何塑造中國與全球AI巨頭的願景

人工智慧, 半導體與芯片, 科技創新

本集深度探討DeepSeek、OpenAI、NVIDIA與台積電如何塑造中國與全球AI巨頭的願景，透過Dylan Patel與Nathan Lambert的第一手對談，解析DeepSeek-V3與R1訓練路徑、開放權重與MIT授權的實際影響，以及預訓練與後訓練的核心差異。並附上GPU小時成本估算、資料處理與可重現性要點，對比o3-mini與o1 Pro等模型性能，洞見未來AI格局與地緣政治動向。

星夜城

2026-03-24