没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:陈俊吉|2016-06-03 11:00:44.000|阅读 1199 次
概述:InfoSphere DataStage 是 IBM 统一数据集成平台InfoSphere Information Server的重要组件,是业界主流的ETL(Extract, Transform, Load)软件。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
在上期发布的文章《分分钟让你学会使用DataStage连通企业级数据库》中,给大家详细介绍过DataStage广泛支持各种异构平台的数据库,提供多种功能强大、类型丰富的数据库连接器,满足企业数据集成所需:
DataStage不仅可以全面支持结构化数据,同样也支持对非结构化数据的访问,例如TXT、CSV、XML、COBOL和Excel文件。今天与大家分享的最佳实践,就是如何通过DataStage的Unstructured Data组件来访问和读取Excel文件。
1. Excel文件名为Employee1.xls,包括3个sheet(sheet1, sheet2, sheet3),其中sheet1存放的是员工及部门信息,sheet2和sheet3都为空,数据样本如下:
2. 设计DataStage作业,从Employee1.xls文件的sheet1表单中抽取属于部门DEPT_B01的员工信息,并输出到文本文件。
3. 编译并运行作业,结果数据如下:
1、Excel文件名为Employee2.xls,包括4个sheet,分别存放DEPT A00,DEPT B01,DEPT C01,DEPT D01这四个部门的员工信息;并且,这4个sheet的数据结构一致,每个sheet的第3行都表示字段名。数据样本如下:
2. 设计DataStage作业,从Employee2.xls文件的所有表单中抽取属于各个部门的员工信息,并统一输出到文本文件。
3. 编译并运行作业,结果数据如下:
1. Excel文件名为Employee3.xls,包括2个sheet(Departments,Employees),分别存放部门信息和员工信息;并且,这2个sheet的数据结构不一致。数据样本如下:
2. 设计DataStage作业,从Employee3.xls文件的多个表单中分别抽取部门信息和员工信息,输出到不同的文本文件。
3. 编译并运行作业,结果数据如下
InfoSphere DataStage不仅能灵活解析并读取Excel多表单文件,而且还能实现创建或写入Excel文件,更能支持多种类型的非结构化数据,
想要了解更多有关DataStage的功能和数据集成场景吗,请访问下面链接:http://bigdata.evget.com/products-16-1.html
via:华南IBM大数据支持团队
更多大数据与分析相关行业资讯、解决方案、案例、教程等请点击查看>>>
详情请咨询“在线客服”!
客服热线:023-66090381
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
嵌入式软件测试工具Parasoft C/C++test 聚焦高可靠性系统开发,提供核心能力三重保障:在编码阶段左移拦截缺陷降低修复成本;自动检查MISRA/CERT/AUTOSAR等安全标准确保合规性;AI智能测试动态优化用例覆盖深度。三者协同构建嵌入式软件质量防护体系,适用于车载、航天等安全关键领域。
企业级软件测试方案Parasoft C/C++test通过预置模板实现快速落地,利用 Docker 镜像固化测试环境确保一致性,并借助一键式集成能力简化复杂流程。帮助团队实现无缝协作与高效交付,避免陷入重复的配置与调试泥潭。
企业级软件测试方案Parasoft dotTEST通过聚合所有质量实践数据,提供一站式质量视图,帮助团队高效识别风险、优化流程,并加速高质量软件的交付。
本文将为大家介绍SciChart在助力蛋白质结构研究中发挥的作用,欢迎下载最新版组件体验~
使用动态内存中列式技术加速分析数据
InfoSphere DataStage助您发现、充实、集成和管理数据的整个生命周期
InfoSphere Data Replication在异构数据存储之间复制数据
Content Manager Enterprise Edition帮助组织管理数字信息,以获取最佳灵活性和影响力
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号