802.16 P組會議紀錄 時間:103年5月22日9:00 地點:暨南大學科三館119教室 主講人:蔡元泰 紀錄:沈遠博 出席者:老師、蔡元泰、陳奕君、沈遠博、李東岳 會議主題:Mel-Cepstrum Based Steganalysis for VoIP-Steganography 會議內容: The proposed steganalyser The cepstrum Mel-frequency cepstrum Test scenario Conclusion References 進度: 1.遠博:storybroad更新,linphone soundcard in/output codec function 理解。 2.東岳:根據message找出相近的pixel值藏入,可以提高capacity 和 psnr值,可以避免RS偵測,再去分析數學的特性和worst case analysis。 3.元泰:判斷有資訊隱藏的條件是甚麼?誤判率如何下降?小波轉換資料偵測模式寫出,接下來要做線性預測程式。 4.奕君:將flowchart寫出,老師建議可以將使用者輸入訊息完再開檔案輸入,就不用將龐大記憶體占住。 問題討論: 主題一: Q1: 縱軸代表甚麼?單位是甚麼?(遠博) ANS:倍率0到1之間。 Q2: 不同顏色的線各代表甚麼意思和對應的function是甚麼?(老師) ANS:遮罩在高頻率比較密集高頻率比較稀疏。 Q3: p.6 得到出的比例是用哪兩個數值的比例?(老師) ANS:頻率的比值,人耳對200赫茲和300赫茲之間的差別與2000赫茲和3000赫茲之間的差別是相同的。 Q4: p.7 Pre-emphasis作的動作是甚麼?(奕君) ANS:聲音訊號通過一個高通濾波器,減少高頻訊號的衰減。 Q5: p.7 framing 和 windowing有甚麼差別?(東岳) ANS:framing 表示訊號取一定數量的集合,為了使framing和framing之間差異不要太大,會使用windows function保持連續性。 Q6: p.9 Str 和 Ste個代表甚麼?(東岳) ANS:svm下所使用的train 和test 的數量。 Q6: p.9 SF代表甚麼的縮寫?(老師) ANS:single features 。 Q7: p.9 Str和Ste數值不同有甚麼差別?(奕君) ANS: train的樣本數越多會越準確。 Q8: feature set 的std和MFCC、FMFCC是代表甚麼?(老師) ANS: 分別為其他標準(中位數,平均...)的single features 和 Mel-frequency cepstral coefficients、filtered Mel-frequency cepstral coefficients。 Q9: p.10數據表有甚麼特殊需要注意的數字?(老師) ANS: 在不同聲音來源下用同樣的隱藏,梅爾倒頻譜其他聲音來源的處理較不佳。 Q10: p.10 為何Steghide(0.4.3)和 Steghide(0.5.1)版本比較新竟然比較容易被偵測出來?(奕君) ANS: 可能是誤差。 Q11: p.9 和 p.10的在隱藏方法皆是LSB時為何兩個偵測效果差距很大?(東岳) ANS: 來源檔案不同,一個是語音檔一種是各種聲音的檔案。 Q12: 最早把梅爾倒頻譜用在資訊偵測的是哪一篇? ANS: 我目前只有找到這篇。 Q13: 此篇paper和你的研究有甚麼關係? ANS: 在一般語音處理上梅爾倒頻譜的效果比線性預測來的好。 建議: 1. 圖片放了要知道自己想要傳達甚麼意思(老師) 2. 在p.6應該加上解釋,梅爾倒頻譜轉換的主要目的是要讓(老師) 3. p.7 後面一個FT應該要加上inverse的符號,儘管paper上有錯,既然發現了就順便修正(老師) 4. 在報告時第一頁能簡短介紹為何要挑此篇paper(老師) 5. p.9 及 p.10 下標多注明縮寫是甚麼會更好。(奕君) 6. 讀paper三個境界:1.看懂 2.表達方式 3.好壞 散會: 結束時間:10:30