Stata: 比對部分字串變數

在作問卷時,有時候問題是 short answer,放到資料庫的時候會用一個字串來表示。如果假設我有一個變數,裡面是問受試者以後想要從事什麼行業,那就會出現五花八門的答案。
1.png
這時候可以作的,就是利用虛擬變量。假設答案裡面不管任何地方,只要出現 lawyer 的,你的 dummy 值為1,沒出現的則為 0。作法很簡單,只有一行而已:
gen dummy = strmatch(lawyer, "*lawyer*")
strmatch 是字串比對的指令,括號中的第一個變數是我的變數名字,第二個變數是要比對的字。但因為我設的規定是:不管 lawyer 出現在變數任何地方都可以,所以在此字串前後都加上了 *。那因為這是字串,所以最外面要加上””。
2.png

標籤: