1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
|
<?xml version="1.0" encoding="UTF-8"?>
<!--
* Scilab ( http://www.scilab.org/ ) - This file is part of Scilab
* Copyright (C) 2012 - Scilab Enterprises - Calixte DENIZET
*
* This file must be used under the terms of the CeCILL.
* This source file is licensed as described in the file COPYING, which
* you should have received as part of this distribution. The terms
* are also available at
* http://www.cecill.info/licences/Licence_CeCILL_V2.1-en.txt
*
-->
<refentry xmlns="http://docbook.org/ns/docbook" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:svg="http://www.w3.org/2000/svg" xmlns:ns5="http://www.w3.org/1999/xhtml" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:db="http://docbook.org/ns/docbook" xmlns:scilab="http://www.scilab.org" xml:id="htmlRead" xml:lang="ja">
<refnamediv>
<refname>htmlRead</refname>
<refpurpose>ローカルまたはリモートファイルからHTMLストリームを読み込む</refpurpose>
</refnamediv>
<refsynopsisdiv>
<title>呼び出し手順</title>
<synopsis>
doc = htmlRead(path [, encoding])
</synopsis>
</refsynopsisdiv>
<refsection>
<title>引数</title>
<variablelist>
<varlistentry>
<term>path</term>
<listitem>
<para>文字列, 読み込むファイルのパス.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>encoding</term>
<listitem>
<para>文字列, ファイルエンコーディング.</para>
</listitem>
</varlistentry>
<varlistentry>
<term>doc</term>
<listitem>
<para>XMLDoc型のmlist</para>
</listitem>
</varlistentry>
</variablelist>
</refsection>
<refsection>
<title>説明</title>
<para>HTMLファイルを読込み, パースします. 返される文書により,
メモリ上に保持したDOMツリーにアクセスできます.
</para>
<para>一般に, HTMLファイルは,整形式であることがまれのため,
XMLパーサーにより読み込むことはできません.
このため,HTMLパーサが必要となり,より適合したものになります.
</para>
<para>HTMLファイルが一度パースされると, メモリ上でXMLファイルとして参照でき,
通常の操作が適用可能になります.
</para>
<para>encoding引数はファイルエンコーディングを明確に
指定する際に使用されます.
</para>
<para>
(メモリーリークを回避するために)<link linkend="xmlDelete">xmlDelete</link>
によりツリーを解放することはできません.
</para>
</refsection>
<refsection>
<title>例</title>
<programlisting role="example"><![CDATA[
doc = htmlRead("http://www.scilab.org");
e = doc.root.children(1).children(1)
e.name
e.content
// 'href'属性を有する全ノードを取得
q = xmlXPath(doc, "//*[@href]");
q(1).attributes
// 文書を削除
xmlDelete(doc);
]]></programlisting>
</refsection>
<refsection role="see also">
<title>参照</title>
<simplelist type="inline">
<member>
<link linkend="htmlReadStr">htmlReadStr</link>
</member>
<member>
<link linkend="xmlGetOpenDocs">xmlGetOpenDocs</link>
</member>
<member>
<link linkend="xmlDelete">xmlDelete</link>
</member>
<member>
<link linkend="xmlDocument">xmlDocument</link>
</member>
<member>
<link linkend="xmlXPath">xmlXPath</link>
</member>
</simplelist>
</refsection>
<refsection>
<title>履歴</title>
<revhistory>
<revision>
<revnumber>5.5.0</revnumber>
<revremark>HTML機能が追加されました.</revremark>
</revision>
</revhistory>
</refsection>
</refentry>
|