word有微軟的專用格式,如果要讀取其內容,可以使用jar包,如下:
創(chuàng)新互聯(lián)專注于彭澤企業(yè)網(wǎng)站建設,成都響應式網(wǎng)站建設,購物商城網(wǎng)站建設。彭澤網(wǎng)站建設公司,為彭澤等地區(qū)提供建站服務。全流程定制網(wǎng)站,專業(yè)設計,全程項目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務
1。用jacob.
其實jacob是一個bridage,連接java和com或者win32函數(shù)的一個中間件,jacob并不能直接抽取word,excel等文件,需要自己寫dll哦,不過已經(jīng)有為你寫好的了,就是jacob的作者一并提供了。
jacob下載:
下載了jacob并放到指定的路徑之后(dll放到path,jar文件放到classpath),就可以寫你自己的抽取程序了,下面是一個例子:
import java.io.File;
import com.jacob.com.*;
import com.jacob.activeX.*;
public class FileExtracter{
public static void main(String[] args) {
ActiveXComponent app = new ActiveXComponent("Word.Application");
String inFile = "c:\\test.doc";
String tpFile = "c:\\temp.htm";
String otFile = "c:\\temp.xml";
boolean flag = false;
try {
app.setProperty("Visible", new Variant(false));
Object docs = app.getProperty("Documents").toDispatch();
Object doc = Dispatch.invoke(docs,"Open", Dispatch.Method, new Object[]{inFile,new Variant(false), new Variant(true)}, new int[1]).toDispatch();
Dispatch.invoke(doc,"SaveAs", Dispatch.Method, new Object[]{tpFile,new Variant(8)}, new int[1]);
Variant f = new Variant(false);
Dispatch.call(doc, "Close", f);
flag = true;
} catch (Exception e) {
e.printStackTrace();
} finally {
app.invoke("Quit", new Variant[] {});
}
}
}
2。用apache的poi來抽取word,excel。
poi是apache的一個項目,不過就算用poi你可能都覺得很煩,不過不要緊,這里提供了更加簡單的一個接口給你:
下載經(jīng)過封裝后的poi包:
下載之后,放到你的classpath就可以了,下面是如何使用它的一個例子:
import java.io.*;
import org.textmining.text.extraction.WordExtractor;
/**
*
Title: pdf extraction
*
Description: email:chris@matrix.org.cn
*
Copyright: Matrix Copyright (c) 2003
*
Company: Matrix.org.cn
* @author chris
* @version 1.0,who use this example pls remain the declare
*/
public class PdfExtractor {
public PdfExtractor() {
}
public static void main(String args[]) throws Exception
{
FileInputStream in = new FileInputStream ("c:\\a.doc");
WordExtractor extractor = new WordExtractor();
String str = extractor.extractText(in);
System.out.println("the result length is"+str.length());
System.out.println("the result is"+str);
}
}
1:知道包名,可以在Overview里直接找到這個包,然后去查這個包下面的類和方法。
2:知道類名和方法名,可以在Index.html里直接去找這個類或方法,然后查看。
3:如果都不知道,可以輸入關鍵字去搜索;或者先在百度搜索下,找到相關關鍵字,然后再在API文檔中搜索。
補充
Java是一門面向對象編程語言,不僅吸收了C++語言的各種優(yōu)點,還摒棄了C++里難以理解的多繼承、指針等概念,因此Java語言具有功能強大和簡單易用兩個特征。
jsp中插入java代碼叫做scriptlet,卸載%%之間。
簡要參考代碼如下:
%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%
%
String a1 ="";
String a2 = "";
long s = 0;
a1 = request.getParameter("a1");
a2 = request.getParameter("a2");
String outs="";
if(a1!=null !a1.trim().equals("") a2!=null !a2.trim().equals("")){
try{
s = Long.parseLong(a1)+Long.parseLong(a2);
outs = String.valueOf(s);
}catch(Exception ex){
outs="您輸入的不是有效數(shù)字!";
}
}
if(a1==null||a2==null) {
a1 ="";
a2 = "";
}
%
!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
html
head
/**新建一個類把下面代碼放進去,注意要設置basePath(你要讀取的文件夾),讀取和寫入的方法也都寫好了.你可以根據(jù)自己的需求掉用就行了**/
static String basePath="/home/csvDir";
/**
* 查找文件夾下所有符合csv的文件
*
* @param dir 要查找的文件夾對象
* */
public static void findFile(File dir) throws IOException{
File[] dirFiles = dir.listFiles();
for(File temp : dirFiles){
if(!temp.isFile()){
findFile(temp);
}
//查找指定的文件
if(temp.isFile() temp.getAbsolutePath().endsWith(".txt") ){
System.out.println(temp.isFile() + " " + temp.getAbsolutePath());
readFileContent(temp);
}
}
}
/**
* @param file 要讀取的文件對象
* @return 返回文件的內容
* */
public static String readFileContent(File file) throws IOException{
FileReader fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr);
StringBuffer sb = new StringBuffer();
while(br.ready()){
sb.append(br.readLine());
}
System.out.println(sb.toString());
return sb.toString();
}
/**
* @param file 要寫入的文件對象
* @param content 要寫入的文件內容
* */
public static void writeFileContent(File file,String content) throws IOException{
FileWriter fw = new FileWriter(file);
fw.write(content);
fw.flush();
fw.close();
}
public static void main(String[] args) {
try {
findFile(new File(basePath));
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
標題名稱:java代碼走查文檔 java代碼走查標準
文章網(wǎng)址:http://muchs.cn/article32/docdepc.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、電子商務、品牌網(wǎng)站設計、微信公眾號、搜索引擎優(yōu)化、面包屑導航
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)