10 x Boost

Thoughts, stories and ideas.

Latest

# 我用 Gemini API 破解了 YouTube 影片秒找關鍵畫面的問題——花了一年才想通的事

在我開始用 Gemini 的 API 之前,我其實在這個問題上卡了很久。你知道那種感覺嗎?就是你明確知道自己想要什麼,但市面上的工具就是不給你。 ▋ 那些沒辦法的時代 最一開始,我想做的事很簡單——從 YouTube 影片裡自動找出特定的畫面。聽起來沒什麼,但當你開始想要把它實際執行出來的時候,馬上就撞牆了。OpenAI 的模型?它們根本不讓你直接處理影片內容。Anthropic 的 Claude?同樣的問題,他們也會限制你對影片的存取權限。就像被隔著一層玻璃,明明看得到東西卻摸不著。 我試過各種繞路。有段時間我想用影片截圖搭配 OCR 去識別,但那效率慘到不行。也想過自己寫爬蟲去抓影片的文字敘述檔,但 YouTube 上大多影片根本沒有,或者敘述檔品質爛到不能用。那段時間我真的很挫折,感覺就像在黑暗裡摸索,不知道哪條路才是出口。 大概花了快要一年的時間,我一直在想同一個問題,嘗試不同的方法,然後一次又一次地失敗。有時候是技術層面的問題,有時候是成本太高根本行不通。那種反覆的無力感,現在回想起來還是有點難受。 ▋ Gemini

By andy

我正在做一個瘋狂的實驗:讓AI掌控我80%的線上形象,看看會發生什麼

老實跟你說,你現在看到的我—聲音、影像、文字—大部分都不是我本人。 這聽起來很詭異,我知道。但這正是重點。 我不是隨便玩玩,也不是為了作秀。我是在親身經歷一個別人都在談論、但很少有人真正去試驗的東西:如果AI能掌控你超過80%的線上生產力,會發生什麼事? ▋ 大多數人的想法都停在20% 現在很多人用AI的方式是這樣的:拿它來寫個開場、潤色個段落、幫忙生成幾張圖。AI扮演的是助手角色,人類才是主導者,還是靠人力來賺錢、維持信譽。這樣當然安全,也很聰明。 但我想知道的是另一個問題。 如果我不是偷偷用AI,而是讓它在前台直接面對你,掌控我80%以上的聲音、文字、影像表現,會怎樣?會崩潰嗎?會被識破嗎?人們會察覺不出來嗎?還是說,這樣的模式本身就會帶來一些我根本預料不到的怪事? 我沒看過有人真的這樣做過,所以我決定自己試試。 ▋ 為什麼我要這樣折騰自己 你可能會問:「為什麼?這不是自找麻煩嗎?」 確實是。但這就像任何真實的實驗一樣,你不下水,你根本不知道水溫。

By andy

別再追風口了——我如何從「快速出產品」的狂歡中走出來,轉向解決自己真正的問題

▋ 那段沉迷「快速出貨」的日子 說實話,當 Vibe Coding 火起來的時候,我也被那種感覺迷住了。能用 AI 這麼快速地把腦子裡的想法變成產品,那種成就感真的滿到爆炸。我記得有一陣子,我幾乎每週都在做新東西——今天做個 X 功能,明天改個 Y 工具,後天又琢磨起 Z 的變體。身邊的人都在說「哇,你動作好快」,我自己也覺得特別充實,彷彿在衝浪一樣踩著科技浪潮的尖端。 但你知道嗎?那種快不是充實,只是上癮。 我現在還記得最清楚的一個例子——我看到有人用生成式 AI 做出超厲害的產品推介功能,能把一堆圖片一鍵轉成專業級的電商影片。那時候我眼睛都亮了,馬上想「這個我也能做,而且我能做得更好」。花了一個禮拜把 MVP 整出來,還挺自豪的。然後呢?Google 用 Nano Banana

By andy

當八十萬粉絲的代價是失去自己:我如何拒絕YouTube的魔鬼交易

我最近想了很久一個問題。如果有人告訴你,只要你改變自己,你就可以擁有幾十萬的粉絲和穩定的收入,但代價是把接下來的每一天都用來製作你不想做的內容——你會簽這個合約嗎? 我聽說有個頻道主,經營了一個擁有八十幾萬粉絲的頻道。老實說,很多人聽到這個數字會先羨慕。但他卻在某一天毅然決然地決定放棄它。不是因為沒有觀眾,而是因為觀眾要他做的事,和他真正想做的事完全相反。演算法喜歡他拍的某些題材,但那些是他最討厭拍的。他想拍的內容呢?流量一般般。在這樣的煎熬裡,他的身心靈一點一點崩潰,直到他決定停止更新。 ▋ 我也在同樣的十字路口站過 我之前有段時間,每週都按時發影片。那時候我慢慢發現了一個模式——流量喜歡我拍的 Cloud Code 相關主題。但這就是問題啊。我本來每週的工作不是只有做這個東西。我在做很多不同的東西,但觀眾似乎只想看那一種。 一開始我試著迎合。每週硬擠出時間來拍這類內容,一邊做著我真正在做的工作,一邊為了維持這個頻道的「人設」而活著。慢慢地,拍影片變成了一種義務,而不是分享。我開始在上傳前就感到疲憊,甚至在發布後才是最累的。不是因為工作量大,而是因為一種莫名的虛無感。

By andy
如何在18分鐘內用AI把想法變成可測試產品:Vibe Coding 實戰全流程(含關鍵數據與風險)

如何在18分鐘內用AI把想法變成可測試產品:Vibe Coding 實戰全流程(含關鍵數據與風險)

導言 Grace Leung 在這支影片中示範如何以「產品思維」結合 AI 工具,將一個語言學習平台的想法在短時間內轉為可上線的 MVP。她提醒:「The biggest challenge most founders, product manager face is no longer building. Building is cheap. Nowadays with AI, it is building something people actually want.」(「最大挑戰不再是建置本身,而是用 AI 建出真實被需要的產品。」)本篇深度分析將系統化整理她示範的三階段流程、關鍵時間與數據、實務操作要點、風險與檢核清單,並補充背景說明與可直接執行的建議。 Grace 提出的流程分為三大階段,強調「以使用者為先」: 1.

By andy

# AI浪潮下,比技術更稀缺的是信任——為什麼我決定用影片去建立它

我經常在半夜想起一個問題:當 AI 每半年就升級一次,我今天學的東西明天就可能過時,那我們到底在堅持什麼? 這個問題曾經讓我相當沮喪。我看著那些新聞標題,什麼 GPT-5 要來了、什麼模型參數翻倍了、什麼開源工具又免費了——每次都像一陣颶風吹過,讓人感覺自己的努力瞬間貶值。我記得有一陣子,我幾乎每週都在重新學習某個新工具,生怕被淘汰。後來我才明白,我焦慮的其實不是技術本身。 ▋ 那些消失無蹤的努力 我花了一年時間精通某個工具,開發了一套完整的工作流程,甚至寫了教程。六個月後,一個新的 AI 工具出現了,以更簡單的方式做了同樣的事。我多年的積累,感覺就像沙灘上的堡壘,一波浪就沖平了。那種無力感是真實的。 許多人都在經歷這個。你花時間建立的技能、寫的代碼、做的優化——這些東西在技術快速迭代的時代,確實有可能變成歷史。這不是說我們不該學習新技術,而是說,單純把時間投進「追逐工具」這件事,本身就是一場追不完的遊戲。 那時我開始問自己:什麼東西是真正不會被取代的? ▋ 信任是唯一的防守 答案浮出來的時候,我有點驚訝自己為什麼沒更早想到—

By andy
如何在不會寫程式也能自動化:Jeff Su 用 ChatGPT+Google Apps Script 一步搞定(1招實作)

如何在不會寫程式也能自動化:Jeff Su 用 ChatGPT+Google Apps Script 一步搞定(1招實作)

導言 Jeff Su 在影片中示範了一個看似簡單但具高度實用性的自動化流程:透過 AI(影片中以「ChachiBt/Chachib」稱呼,實際上為 ChatGPT 類型的語言模型)產生 Google Apps Script 程式碼,將每週收到的電子報自動存入 Google 文件,便於日後查閱。核心議題是「用 AI 補上程式能力的差距」,關鍵人物則是內容創作者 Jeff Su 與扮演自動化專家的 AI 助手。以下為重組後的深度解析與實務建議。 主題:把每週收到的電子報自動存成 Google 文件,免手動複製貼上。 案例關鍵句(原話引用):「act as an automation expert with knowledge of Google app

By andy

AI專案9成失敗的真相:技術再強也沒用,關鍵在「工程師和使用者能否說上話」

我在公司推過不少AI專案,慢慢領悟到一個扎心的事實——很多人搞反了。我們總以為AI失敗是因為技術不夠牛、功能不夠酷、或使用者太難搞,但其實根本不是。失敗的原因很單純:工程師和使用者根本沒在同一頻道上。 ▋ 我們都曾犯過的錯 還記得之前有個專案,技術團隊拿出來的東西真的很亮眼。架構漂亮、演算法先進、功能堆得滿滿的。我看著那套系統的介紹文件,心想「這次肯定會轟動」。結果呢?上線後沒人用。沒人用。 反過來,也有專案是使用者把他們的需求講得天花亂墜。「我們需要這個功能、那個功能,還有這個自動化流程,最好再加上那個整合……」工程師在旁邊狂記筆記,眼神發光。大家都很興奮。然後開發開發開發,最後交付的東西,使用者看一眼就說「欸,這不是我要的」。 你知道最氣的是什麼嗎?雙方都沒錯。工程師做的技術沒問題,使用者說的需求也沒問題。問題在於中間那條線斷掉了——他們根本沒有真正對話過。 ▋ 為什麼使用者會不買單 我後來才理解,使用者其實不在乎你的技術有多強。他們不會坐下來說「我想要一個用神經網路訓練過的系統」。他們只會說「欸,我現在每天要處理這堆文件,超煩的」

By andy

# 創業失敗後我才懂:眼界決定天花板,我為什麼每天追蹤全球AI資訊

我還記得創業失敗那段時間的感受。不是因為產品不好、不是因為技術不行,而是坐在台灣辦公室裡,我們一直在和自己玩。後來才明白,我們根本不知道世界在幹什麼。 那次失敗其實給了我一個很狠的一巴掌。當時我在想,為什麼同樣的想法,美國已經有人做出來了?為什麼我們總是慢半拍?答案很簡單:因為我們的眼界卡在台灣。市場小、資訊晚、決策也慢。當全球創業者都在衝的時候,我們還在看去年的新聞。 ▋ 出國工作改變了我的視角 後來我出國工作了一段時間。這段經歷改變了我對「資訊」的理解。我才發現,其實我們缺的根本不是聰明才智,缺的就是「第一線的資訊」。差一天拿到資訊和晚兩個禮拜拿到資訊,在創業的世界裡可能就是生死之差。 在國外的日子,我開始習慣每天刷Twitter、看最新的Hacker News、追蹤業界的關鍵人物。那時候我才真正體會到,資訊戰其實就在發生——那些走在前面的人,就是因為他們比別人早知道一些東西。而我之前根本沒意識到這一點。 ▋ 決定做一個「資訊轉運站」 所以才有了現在的頻道。與其每個人都像我一樣累死累活地四處尋找資訊,不如我來幫大家把全球最前沿的東西篩一遍、整理一遍、傳下去。

By andy
如何用Perplexity Comet的10大AI代理,10分鐘內自動化研究與行銷任務

如何用Perplexity Comet的10大AI代理,10分鐘內自動化研究與行銷任務

Perplexity AI已從單純的AI搜尋引擎蛻變為強大的AI代理工具,其最新產品Comet更被譽為「AI瀏覽器」,不僅能搜尋資訊,還能主動執行複雜任務。本視頻深入探討Comet的應用潛力,分享10種實用AI代理,從即時競爭分析到銷售漏斗優化,幫助使用者大幅縮短工作時間。透過瀏覽器整合與Google Workspace連結,Comet讓AI成為個人助理,特別適合行銷人員、研究者和企業主,實現從資訊蒐集到行動執行的全自動化流程。 Perplexity Comet提供兩種主要操作模式:主聊天視窗適合處理多步驟的複雜代理任務,而助理側邊欄則適用於網頁內的快速情境任務。這種設計讓使用者能無縫整合瀏覽器環境,避免傳統研究中開啟數十個分頁的混亂。 視頻強調,Comet的核心優勢在於其代理功能,能跨多個瀏覽器分頁擷取上下文,並自動瀏覽、分析和執行動作。例如,在競爭分析中,它不僅讀取首頁,還深入關鍵子頁面,取代人工複製資料的繁瑣過程。這種自動化可將原本需數小時的任務縮短至15分鐘,並直接匯出報告至Google文件,提升效率。 即時行銷情報代理:競爭分析新利器 第一種代理是「即時行銷

By andy

AI模型進化太慢?測試Grok FAST後,我發現:智力提升20%,但短期還不夠用

最近,我沉迷於測試各種AI模型來改寫文章, 試圖找出最適合內容創作的工具。 核心議題是AI在處理複雜任務時的表現, 尤其是像Grok FAST這樣價格僅為一般模型四分之一的「迷你級」選擇。 雖然它聽起來划算,但實際測試卻充滿挑戰, 讓我重新思考AI成長的速度與潛力。 ▋ 在測試改寫文章時, 我發現Grok FAST經常產生「幻覺連結」—— 那些不存在的、虛構的參考來源。 這讓我原本的期待落空: 它雖然便宜25%, 但在生成可靠內容上, 仍遠遠落後於更昂貴的模型。 背景來說, 「幻覺」是AI常見問題, 指模型編造事實, 尤其在低成本版本中更明顯。 我的測試顯示, 簡單改寫還可, 但一涉及事實查證, 就容易出錯。 ▋ 複雜任務的挑戰 過去,我多次嘗試讓AI處理高難度工作, 例如從一篇文章中提取六個關鍵重點, 並為每個重點梳理大標、主標和小標。 結果很清楚: 只有「越聰明」的模型才能勝任。 例如,頂級模型如GPT-4能精準結構化內容, 而Grok FAST等低階版往往混亂無章。 這讓我反思: 每年AI模型都在進化, 理論上便宜模型應能逐步

By andy
2025年AI影片真實挑戰:4步驟克服連貫性難題,遠非頭條所說的取代好萊塢

2025年AI影片真實挑戰:4步驟克服連貫性難題,遠非頭條所說的取代好萊塢

YouTube頻道主Jeff Su在最新影片中直擊AI影片生成的現實面,粉碎了媒體頭條中「AI即將取代好萊塢」的迷思。作為一位專注AI工具實戰的內容創作者,Su透過生動示範和簡單類比,揭示AI影片雖強大卻受限於「連貫性」瓶頸。他強調,目前AI能輕鬆產生逼真片段,但要串聯成完整故事,仍需特定工作流程。這不僅適用於YouTuber或電影製作者,更為2025年AI應用提供實用洞見。 Jeff Su一開頭就駁斥媒體炒作,他表示:「如果你相信頭條,好萊塢電影產業將在幾分鐘內被AI取代。但事實上,我們還遠遠不夠。」 Su使用ChatGPT類比說明AI的強項與弱點:當要求ChatGPT撰寫電視劇開場場景時,它能在數秒內產生包含設定、角色和劇情的腳本;續寫下一場景時,AI能「記住」前情,維持角色、設定和故事的一致性。這突顯AI在文字生成上的連貫優勢。 然而,轉移到影片領域,情況大不同。Su指出,連貫性是AI影片生成的最大障礙。即使使用先進工具如Google的Veo app(Su稱之為Flow),AI也難以維持跨場景的角色外貌、聲音和背景穩定。 示範AI影片的強大與局限 Su親自示

By andy