比如有时需要对变量
取对数
,gen lnvar = ln(var),以及求平均数等egen;
字符型数据和数值型数据的转换
,可以生成新的encode和decode出马,也可以在原来的变量上直接变换,destring和tostring,replace force,强制执行;
改变变量名字rename;
等等等等,具体详见内容
*- 用by——按照rep78对price变量数据分组求最小值
sort rep78
by rep78 : egen meanprice_rep78_by = mean(price)
*- 用bys——按照rep78对price变量数据分组求最小值
bys rep78 : egen meanprice_rep78_bys = mean(price)
tostring year,
replace force
有些时候,将数据录入Stata中后,即使变量是数字,但是Stata识别成了字符型变量,可以使用destring将其转化为数值型变量。
将上一步转换为字符型的year变量转化为数值类型:
destring year,
replace force
8、substr() 命令
substr()函数可以截取字符串的某些位置,通常结合tostring/destring命令使用
截取年份变量year的后两位:
第一步
,如果year变量是数值型,先将其转换为字符型
tostring year,replace force
第二步
,采用substr()函数截取后两位
g year_last2=substr(year,3,2)
参数year,3,2分别表示从year变量的第3个字符开始,截取2个字符。
第三步
,将year和year_last2变量转化为数值型
destring year year_last2,replace force
*- 用by——按照rep78对price变量数据分组求最小值
sort rep78
by rep78 : egen meanprice_rep78_by = mean(price)
*- 用bys——按照rep78对price变量数据分组求最小值
bys rep78 : egen meanprice_rep78_bys = mean(price)
*- encode,生成数值型变量
encode make, gen(m)
*- decode,生成字符型变量
decode m, gen(strm)
*- 现在edit窗口随便复制粘贴到最后,然后按照下面操作
*- 列出重复的数据
duplicates list make
*- 删除重复的数据
duplicates drop make, force
文章目录
stata
中变量生成命令:gen和egengenegen按照变量分组egen注意区别gen和egen
stata
中变量生成命令:gen和egen
egen 和 gen 都用于生成新变量,但egen 的特点是它更强大的函数功能。 gen 可以支持一些函数, egen 支持额外的函数。如果用 gen 搞不定,就得用egen想办法了。
在分析的过程中,有些变量并没有在
数据
中提供,需要我们用...
先补充几个基本命令。
cd:很多编程软件中都有该命令,该命令主要负责更改当前工作路径,一般
stata
的默认路径是你安装的路径,所以保存的文件也在你安装的路径中,如果你想更改当前的工作路径,需输入:cd D:\example,之后你的工作路径便在 D:\example。