R语言如何将大型Excel文件转为dta格式详解
- 软件编程
- 2026-01-11 00:45:40
本文以2000年度我国工业企业数据库为例,该文件后缀名为xlsx,包含约16万条记录,文件有88M这么大。直接使用Excel打开都费劲:等待时间久,电脑风扇呼呼呼作响。如果尝试用Stata打开该xlsx文件,则会出现提示报错。

报错原因在于,Stata无法读取超过40M的Excel文件。
这就好比瓜迪奥拉的传控足球固然美丽,但是面对摆大巴的球队无能为力。
破大巴需要攻城锤,这把锤子的名字就是R语言。万事开头难啊,正憧憬着数据清洗和花式选取变量建模呢,可不能连数据们长啥模样都没见着啊。R语言适时挺身而出,帮助Stata叩开大型Excel文件之门。
在RStudio中运行如下代码,过程较为浅显,首先引入两个R包,然后输入xlsx后缀名文件,最后便可输出dta后缀名文件。等待2分钟,谁让文件那么庞大呢,接下来便是见证奇迹的时刻。
library(openxlsx)
library(foreign)
x = read.xlsx('2000.xlsx',1) # 读取 Excel 的 Sheet1
# View(x)
write.dta(x, '2000.dta') # 输出为 Stata 能读取的格式
在Stata中打开该文件,屏幕会显示这份文件是在R中转化而来。
也许你有更好的转化方法,欢迎赐教。
总结
# 你有
# 为例
# 之门
# 是在
# 这份
# 该文件
# 报错
# 这就
# 便可
# 这么大
# 而来
# 都没
# 这把
# 迪奥
# 挺身而出
# 无能为力
# 则会
# 见着
# 万事开头难
# r语言读取excel
# r语言读取excel文件
# r语言转
# dta
# R语言对Excel文件操作实例
# R语言-如何循环读取excel并保存为RData
# R语言之xlsx包读写Excel数据的操作
# R语言读取excel数据的方法(两行命令)
# 轻松学会R语言识别Excel日期
# 工业企业
相关栏目:
【
教研文案 】
【
日常文案 】
【
AI模型 】
【
网络运营 】
【
营销推广 】
【
云计算 】
【
技术教程 】
【
软件编程 】
【
汉字学习 】
【
歌词歌曲 】
【
精选文章 】
相关推荐:
Python urlopen()参数代码示例解析
解决docker指定udp端口号的问题
Python爬虫进阶之爬取某视频并下载的实现
springboot如何读取application.yml文件
C++ 浅谈emplace_back及使用误区
JavaScript实现复选框全选和取消全选
Docker 使用nsenter工具进入容器的操作
对docker中的overlay式网络详解
MySQL数据库锁机制原理解析
支付宝小程序向用户发红包的实现方法
PHP如何解决微信文章图片防盗链
小程序角标的添加及绑定购物车数量进行实时更新的实现代码
给Docker更换国内镜像源操作
SSO单点登录系统实现原理及流程图解
Tomcat首次部署web项目流程图解
python-地图可视化组件folium的操作
scrapy redis配置文件setting参数详解
java使用jar包生成二维码的示例代码
python实现经纬度采样的示例代码
Python Selenium XPath根据文本内容查找元素的方法
解决Pymongo insert时会自动添加_id的问题
sql server把退款总金额拆分到尽量少的多个订单中详解
selenium判断元素是否存在的两种方法小结
Vue实现购物小球抛物线的方法实例
docker安装redis设置密码并连接的操作
python可视化 matplotlib画图使用colorbar工具自定义颜色
Windows安装Openssl并使用Openss生成公钥私钥
深入探究ASP.NET Core Startup初始化问题
一篇文章教你用python画动态爱心表白
MySql范围查找时索引不生效问题的原因分析
C#中is,as,using关键字的使用说明
C# Dockpanel入门基础必看篇
go install/build生成的文件命名和路径操作
Goland支持泛型了(上机实操)
在vue中动态修改css其中一个属性值操作
python实现文件分片上传的接口自动化
Django中使用Celery的方法步骤
python3通过subprocess模块调用脚本并和脚本交互的操作
C语言中if语句加大括号和不加大括号的区别介绍
C++计算整数序列的最长递增子序列的长度操作
使用IDEA配置Tomcat和连接MySQL数据库(JDBC)详细步骤
使用PyCharm官方中文语言包汉化PyCharm
Java map.getOrDefault()方法的用法详解
详解Go内存模型
Python 多进程、多线程效率对比
PyTorch 中的傅里叶卷积实现示例
pandas抽取行列数据的几种方法
Java人机猜拳实现的思路及方法实例
CentOS 7.x docker使用overlay2存储方式
Nginx服务器添加Systemd自定义服务过程解析
本文转自网络,如有侵权请联系客服删除。
热门内容推荐
C#使用虚拟方法实现多态
- 2026-01-11
JavaScript原生对象之String对象的属性和方法详解
- 2026-01-11
js实现DOM走马灯特效的方法
- 2026-01-11
轻松创建nodejs服务器(1):一个简单nodejs服务器例子
- 2026-01-11
php实现微信公众平台账号自定义菜单类
- 2026-01-11
