作者拍下兩人對打(對抗)或兩人跳舞(合作)的影片,並轉換成point light的形式。在這個實驗裡使用了兩種程序,第一種,synchronized,單純把原長22秒的影片截成兩段11秒的影片(AA與BB);第二種,desynchronized,把AA段和BB段中,任一人的動作截取出來並加以合併,可得AB或BA兩種情況。
Sync和deSync整體上包含的軌道都相同,它們的差異在於只有Sync的動作才有意義性。由於我們可以了解動作的semantics,所以我們不只可以解讀單一人的動作,還可以預測並解讀兩人動作之間的關係。實驗的作法是在每個trial之間呈現兩個從Sync或deSync中抽取出的intervals,其中對打抽取1.5秒的長度,跳舞抽取出3秒的長度;兩個intervals中一個是"target" interval,另一個是"nontarget" interval,nontarget interval把其中一人的光點打散呈現。受試者要選出包含兩個人動作的interval (target interval)。為了測試在Syn和deSync下辨識的敏感度,作者之用的方法有兩種,一是畫面上同時會散佈數量不一的點(noise),二是操弄nontarget光點打散的程度。
實驗結果顯示,在Sync的情況下受試者對於noise和打散程度(scrambling)的忍受性明顯高於deSync,顯示對於Sync的辨識度高過deSync。然而為了確認實驗的效果不是來自於一些low-level cues (光點分佈的遠近或是移動的一致性等等),作者又執行一個控制實驗,即是將畫面中的一人上下顛倒(target情況下隨機選擇一個,nontarget情況下選擇未被打散的那個);這樣仍保持大部份的low-level cues,但是動作的semantics則被消除(我們很難理解上下顛倒的point-light agents的動作)。如果Sync和deSync之間的差異沒有因為這樣的操弄而消除的話,那我們可以認為差異的來源的確是那些low-level cues,反之則是來自動作的semantics。實驗結果顯示low-level cues不是差異的原因。
這篇paper的結果顯示,兩個動作產生者之間的互動關係相較於單一動作者有意義的動作,可以引導動作辨識的處理,而達到更好的辨識度,由於這篇paper提到目前沒有其他研究探討到這種top-down的處理歷程,如此複雜的動作辨識運用到的腦部區域可能超出目前的理論範圍,也許可以進一步使用造影的方式加以研究。