博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
NPOI处理Word文本中上下角标
阅读量:5809 次
发布时间:2019-06-18

本文共 2222 字,大约阅读时间需要 7 分钟。

原文:

读取Word文档,并将文本转成html标签,后面发现,经常有带上下角标的内容,于是一并处理了。

核心在于对XWPFRun对象中Subscript属性的处理。

1         ///  2         /// 读取Word,并识别文本中的上下角标 3         ///  4         ///  5         /// 
6 public static string ReadWordTextExWithSubscript(string fileName) 7 { 8 9 string fileText = string.Empty;10 StringBuilder sbFileText = new StringBuilder();11 12 #region 打开文档13 XWPFDocument document = null;14 try15 {16 using (FileStream file = new FileStream(fileName, FileMode.Open, FileAccess.Read))17 {18 document = new XWPFDocument(file);19 }20 }21 catch (Exception e)22 {23 throw e;24 }25 #endregion26 //正文段落27 foreach (XWPFParagraph paragraph in document.Paragraphs)28 {29 //获取段楼中的句列表30 IList
runsLists = paragraph.Runs;31 32 sbFileText.Append("

");33 foreach (XWPFRun run in runsLists)34 {35 switch (run.Subscript)36 {37 case VerticalAlign.BASELINE:38 sbFileText.Append(run.Text);39 break;40 //上角标41 case VerticalAlign.SUPERSCRIPT:42 sbFileText.Append("" + run.Text + "");43 break;44 //下角标45 case VerticalAlign.SUBSCRIPT:46 sbFileText.Append("" + run.Text + "");47 break;48 default:49 sbFileText.Append(run.Text);50 break;51 }52 53 }54 sbFileText.AppendLine("

");55 }56 fileText = sbFileText.ToString();57 58 return fileText;59 }

Word文档:

输出:

<p>测试<sup>上</sup><sub>下</sub>ok。</p>

<p>CO<sub>2</sub></p>
<p>面积约6000km<sup>2</sup></p>

Html预览:

 

转载地址:http://srjbx.baihongyu.com/

你可能感兴趣的文章
spark SQL学习(spark连接 mysql)
查看>>
c博客作业--函数
查看>>
java排序算法之冒泡排序(Bubble Sort)
查看>>
一起学习模拟电路之1
查看>>
【模板】三维偏序
查看>>
Express4.X中的bin/www是作什么用的?为什么没有后缀?
查看>>
宝塔建站报错
查看>>
yii2 修改验证码小部件样式
查看>>
php 导出导入excel
查看>>
配置容器configuring Containsers
查看>>
Mongodb 的学习
查看>>
Error: [vuex] vuex requires a Promise polyfill in this browser. 与 babel-polyfill 的问题
查看>>
log4j2 配置入门
查看>>
ASP.NET MVC 入门1、简介
查看>>
转 数据库常用命令
查看>>
django连接sqlserver
查看>>
Ubuntu12.10 使用JLink连接开发板用arm-gdb调试ARM程序
查看>>
有用的 JS 和 CSS 库
查看>>
上传图片到OSS异常解决方法
查看>>
嵌入式第十次
查看>>