REC-xml-19980210-tw
�i�X�i�Хܻy��(XML) 1.0
W3C ��ij�� 1998�~2��10��
- ������:
- http://www.w3.org/TR/1998/REC-xml-19980210
- http://www.w3.org/TR/1998/REC-xml-19980210.xml
- http://www.w3.org/TR/1998/REC-xml-19980210.html
- http://www.w3.org/TR/1998/REC-xml-19980210.pdf
- http://www.w3.org/TR/1998/REC-xml-19980210.ps
- �̷s����:
- http://www.w3.org/TR/REC-xml
- �W�@����:
- http://www.w3.org/TR/PR-xml-971208
- �s��:
- Tim Bray (Textuality and Netscape) <[email protected]>
- Jean Paoli (Microsoft) <[email protected]>
- C. M. Sperberg-McQueen (University of Illinois at Chicago) <[email protected]>
�K�n
�����a�y�z�F�i�X�i�Хܻy�� (Extensible Markup Language�AXML)
���U����T�CXML�i���O�зdzq�μХܻy�� (Standard Generalized Markup
Language�ASGML) ���l���X�A��@�ΥD�n�O���q�Ϊ� SGML
�]��{�����W�쵲�Хܻy�� (HyperText Markup Language�AHTML)
�@�ˡA�i�H�b Web �W���ѪA�ȡB�����γB�z��Ƶ��u�@�CXML
�Q�]�p���Q���e����@ (Implementation)�A�åB�]���� XML �P SGML �� HTML
���������q�\��C
�����w�l���P���A
�����w�g�� W3C
��´���������ά�������f�\�L�A�äw�Q��´�����z�Ƨ�㬰 W3C
��ij�� (W3C Recommendation)�C�����@��í�w����� (Ķ��:
���ܤ��|�g�`�ק�)�A�i�H���@�ѦҸ�ơA�]�i�@����L������ѦҤ��m�CW3C
�b��w��ij�ѹL�{��������O���F�l��� XML
�W�檺�`�N�A�H�P�i��Q�s�x�a�ϥΡC�p���K��W�j Web
���\��Τ��ʩʡC
���W��ѳW�w�F�@�إi�Ω���y��T�� (World Wide Web)
���y�k�A���y�k�O�ھڤ@�Ӥw�s�b�üs�x�ϥΪ���ڤ�r�B�z�з� (�N�O
Standard Generalized Markup Language�ASGML�A�зdzq�μХܻy���A���g�L�ץ��L��
ISO 8879:1986(E) �з�) ���l���X�ӫإߪ��C���� W3C XML ��w�u�@ (XML
Activity) �����G�A���� XML ��w�u�@���ԲӸ�T�i�H�bhttp://www.w3.org/XML���C�bhttp://www.w3.org/TR�i�H���ثe W3C
��ij�ѩM��L�N��C���C
���W��Ѥ��ϥΤF [Berners-Lee ���H] �w�q���@�ӳN�y
URI�A�L�̥��b�q�Ƨ�s[IETF RFC1738]�M[IETF
RFC1808]���u�@�C
���W��Ѫ��w�����~�C���i�H�bhttp://www.w3.org/XML/xml-19980210-errata���C
�бN��������~�H�q�l�l�覡�ǰe��[email protected]�C
�i�X�i�Хܻy��(XML) 1.0
�ؿ�
1. ����
1.1 �t�_�M�]�p�ؼ�
1.2 �N�y
2. ���
2.1 ���X�k�� XML���
2.2 �r��
2.3 �q�λy�k�غc
2.4 �r����ƩM�Х�
2.5 ����
2.6 �B�z����
2.7 CDATA�q
2.8 �e���M��������ŧi
2.9 �W�ߤ��ŧi
2.10 �ťճB�z
2.11 ����B�z
2.12 �y������
3. �赲�c
3.1 �_�l���ҡA�������ҩM�Ť�������
3.2 ���������ŧi
3.2.1 ���������e
3.2.2 �V�X�����e
3.3 �ݩʪ��ŧi
3.3.1 �ݩ�����
3.3.2 �ݩʪ��w�]��
3.3.3 �ݩ�-�ȹ諸�W�d��
3.4 ����q
4. ���z���c
4.1 �r���M����ޥ�
4.2 ����ŧi
4.2.1 ��������
4.2.2 �~������
4.3 ��R�L����
4.3.1 �奻�ŧi
4.3.2 ���X�k����R�L����
4.3.3 ���餤���r���s�X
4.4 XML�B�z�������M�ޥΪ��B�z
4.4.1 ���Q�ѧO
4.4.2 �Q�]�t
4.4.3 �i�����ҮɳQ�]�t
4.4.4 �Q�T��
4.4.5 �Q�]�t�b�r���W��Ƥ�
4.4.6 �q��
4.4.7 ���B�z
4.4.8 ���� PE �ӥ]�t
4.5 ��������m���奻���c��
4.6 �w�w�q����
4.7 �O�k�ŧi
4.8 ������
5. �@�P��
5.1 �i�����ҩM���i�����Ҫ��B�z��
5.2 �ϥ�XML�B�z��
6. �O�k
����
A. �ѦҤ��m
A.1 �����ѦҤ��m
A.2 ��L�ѦҤ��m
B. �r�������O
C. XML�MSGML(�D����)
D. ����M�r���Ѥު��i�}(�D����)
E. �M�w�������e�ҫ� (�D����)
F. �r���s�X���۰��˴�(�D����)
G. W3C XML�u�@��(�D����)
�i�X�i�Хܻy�� (�Y�g�� XML) �ΨӴy�z�@�غ٬�XML�������ƪ���A�P�ɤ]�����a�y�z�F�B�z�o�Ǹ�ƪ��{���]�p�覡�CXML
�O SGML (�зdzq�μХܻy��[ISO 8879])
�b���ΤW���@�Ӥl���X�A�ά� SGML
���Y�ح���Φ��C�ھڨ�w�W�檺�w�q�AXML���O�ŦX�W�檺 SGML
���C
XML���Ѻ٬��������x�s�椸�Ҳզ��A�ӹ���i�H�]�t��R�L
(Parsed) �Υ���R�L (Unparsed) ����ơC�w��R�L����ƥ��r���զ��A�䤤�@�Ǧr���զ��r������A�t�@�Ǧr���զ��Х��C�Хܤ��]�t�F������x�s�榡 (Storage layout)
�M�赲�c (Logical structure) ���y�z�C�]�� XML
�i���O���ѤF�@�إi�Ω�W�d�έ����x�s�榡�M�赲�c������C
�@�غ٬�XML �B�z�� (XML Processor)
���n��ҲլO�Ψ�Ū�� XML���A�ô��Ѧs����e�ε��c����k�C���]�i�H�B�z ���ε{�� (Application)�C�w�� XML
�B�z�����p��Ū�� XML
��ơA�H�������ѭ��Ǹ�T�����ε{����譱�A���W��Ѵy�z�F��һݾ֦����ʧ@�P�ާ@�覡�C
XML�� XML �u�@�� (����� SGML �s��f�d�e���|) �Ҷ}�o�A���u�@�զb
1996 �~�ѥ��y��T����| ( World Wide Web Consortium�AW3C)
�Ҧ��ߡC�Ӥu�@�ժ��t�d�H�O Sun Microsystems�� Jon Bosak�A�P�� W3C
��´�� XML Special Interest Group (����� SGML�u�@��)
�]�n���ѻP�F�o���u�@�C���� XML
�u�@�դ������m�W�аѦҪ����C�u�@�ջP W3C ���pô�H�� Dan Connolly�C
XML ���]�p�ؼЦp�U�G
- XML ���ӥi�H�����b Internet �W�ϥΡC
- XML ���ӥi�H�䴩�h�ؤ��P�����ΡC
- XML ���ӭn��P SGML �ۮe�C
- �B�z XML ��{�����ӭn�ܮe�����g�C
- XML ���i��ܩʪ��\�� (optional features)
�����i��a��̤ܳ֡A�z�Q���p�U���� 0 �ӡC
- XML ������ӯ�����H�����\Ū�A�åB����M�����Q�z�ѡC
- XML ���]�p���ɳt�����C
- XML ���]�p���ӬO������ (formal) ��²�䪺 (concise)�C
- XML ������ӯ�ܮe�����إߡC
- XML �Х� (Markup) ��²�Ƴ����O�����n���C(Ķ���G���ؼЬO���F�ѨM
SGML ����²�� (Minimization) �����D)
���W��ѻP��L�������з� (Unicode �M ISO/IEC 10646 �w�q�r�����AInternet
RFC1766 �w�q�y���ѧO�X�AISO 639 �w�q�y���W�٥N�X�AISO 3166
�w�q��a�W�٥N�X)�A�@�_���ѯ�F�� XML ���� 1.0
�W��Ϋإߨ�B�z�{���ݭn���Ҧ���T�C
�u�n�৹��a�O�d XML 1.0 �W��Ѥ��Ҧ�����r���e�Ϊ��v�`�N�ƶ�
(legal notices)�A�h�������� XML �W��ѫK�i�ۥѴ��G (distributed freely)�C
�b���� XML
���ɩҨϥΪ��N�y���|�b���W��Ѫ����夤�w�q�C�b�إ߳o�ǩw�q�δy�z�@��
XML �B�z�����ʧ@�ɡA�ϥΤU���C�������N�y�G
- �i�H (may)
- ���\�ŦX�W�檺���M XML
�B�z���̷өҴy�z���覡�i��B�@�A�����n�D�����p���C
- ���� (must)
- �n�D�ŦX�W�檺���M XML
�B�z���̷өҴy�z���覡�i��B�@�F�_�h�|�X�{���~�C
- ���~ (error)
- �Y�H�I���W��Ѥ����W�h�F�h�o�쪺���G�O�S���w�q���C�ŦX�W�檺�n��i�H�����Χi�����~�A�B�i�H�q���~����_�C
- �Y�����~ (fatal error)
- ���ؿ��~�O�ŦX�W�檺XML�B�z���������˴��X�ӡA�æV���ε{���i�����C���F���U�ץ����~�A�B�z���i�N����g�B�z�����
(�V�X�r����ƩM�Хܸ��)
�ǰe�����ε{���C�M�Ӥ@���˴���@���Y�������~�A�h�B�z�������פ�@�몺��ƳB�z
(�]�N�O���A����������H�@�몺�覡�A�ǻ���������赲�c���r����Ƥθ�T�����ε{��)�C
- �ѨϥΪ̿�� (at user option)
- �ŦX�W�檺�n��i�H�Υ��� (�ݵ���y�l�����y�A�ʵ� modal verb)
���өҴy�z���欰�ӹB�@�F�p�G���ŦX���B�@�欰�A
�h�������ѨϥΪ̤@�ؤ�k�A����k����M�w�O�_�ϥ� (Enable)
�θT�� (Disable) �Ҵy�z���欰�B�@�覡�C
- ���T�X�k�ʭ��� (validity constraint)
- ������A�Ω�Ҧ����T�X�k�� (valid) XML��W�h�C�Y�H�I���T�X�k�ʪ�����N�������~;�i�楿�T�X�k�����Ҫ� XML �B�z�������g�ѨϥΪ̿��
(At user option) �O�_�i���o�ǿ��~�C
- �Φ��X�k�ʭ��� (well-formedness constraint)
- ������A�Ω�Ҧ��Φ��X�k�� (well-formed) XML
��W�h�C�Y�H�I�Φ��X�k�ʪ�����N�����Y�����~�C
- �۲� (match)
- (�w���r��M�W�١G)
�Q�������Ӧr��ΦW�٥��������ۦP (Identical)�C�b ISO/IEC 10646
�����h�إi����ܤ覡���r�� (�Ҧp:�w���w�q (Precomposed) �Φ��ΰ�¦
(Base) + �ܭ��� (Diacritic) �Φ����r��)
�u�b���Ӧr�ꪺ���ܤ覡�ۦP�ɤ~���ܬ۲šC�ѨϥΪ̿�ܡA�B�z���i�N�o�Ǧr�����Y�سW�d
(Canonical) �Φ��зǤơC�����B�ä��|�ഫ�r�����j�p�g�C(�w���k�����r��M�W�h�G)
�p�G�r���ݩ�Y�Ӥ�k���ͳW�h���Ҳ��ͪ��y���A�h���۲ũ�o�Ӳ��ͳW�h���C(�w�鷺�e�M���e�ҫ��G)
���@�Ӥ����ŦX"�������T�X�k��"����y�z�ɡA�������|�ŦX�����ŧi
(declaration)�C
- �w��ۮe�ʦҶq (for compatibility)
- ���S�ʶȨϥΩ�T�O XML ���¬ۮe�� SGML�C
- �w�郎�q�ʦҶq (for interoperability)
- ���W��ѥ]�t�@�Ӥ���ĤO����ij���e�A�ت��O���F�W�[XML���A��Q
ISO 8879 WebSGML ��s���� (WebSGML Adaptation Annex) ���e�N�s�b�� SGML
�B�z���B�z�����|�C
�p�G�@�Ӹ�ƪ���ŦX���W��Ѥ��Φ��X�k (well-formed) ���w�q�ɡA���N�O�@��XML���
(XML document)�C�@�����X�k��XML���A�p�G�������Y���B�~������A�h�i�i�@�B�������T�X�k�� (valid) ���C
�C�� XML �����W (Logical) ���z�W (Physical)
�����c�C�N���z�W�Ө��A���O�Ѻ٬� ���� (Entity)���椸�Ҳզ��C�@�ӹ���i�H
�ޥ� (refer)��L����ñN���]�A�b��C
���}�l��"�ڤ��� (Root �� Root element) " ��������
(document entity) ���C�N��W�Ө��A�N��W�Ө��A���ѫŧi
(Declarations)�B���� (Elements)�B���� (Comments)�B�r���Ѥ� (Character
references) �P�B�z���� (Processing Instructions�API)
�Ҳզ��A�Ҧ��o�Dzզ��椸���|�b��ϥΩ��㪺�ХܨӥN���C��M���z���c������"
4.3.2 �Φ��X�k����R�L����"���Ҵy�z�����Y��a�B�z�_�����c
(nest)�C
�Y�@�Ӥ奻���� (textual object)
�O�@���Φ��X�k�� XML ���A���ݭn�����H�U�n��G
- �۲ũ�
document
�����ͳW�h���C
- �������W��Ѥ��ҩw�q���Ҧ��Φ��X�k�ʭ���C
- ��������ζ����ޥΪ��C����R�L�������O�Φ��X�k���C
�۲�document
���ͳW�h���N�ۡG
- ���]�t�@�өΦh������.
- ��Ȧ��@�Ӥ����٬��ڤ��� (Root element)�Τ��
(document element)�A�ڤ������X�{�b��L���������e
(content)���C����L�����Ө��A�p�G�_�l���� (start-tag)
�b�t�@�Ӥ��������e���A�h�䵲������ (end-tag)
�]�|�b�P�@���������e���C���ӧ�²�檺���k�A�ϥΰ_�l���ҩM�������ҧ@�����j���U�Ӥ����A�����Y��a�̷ӱ_�������Ǩө�m
(Ķ���G���P�ժ��_�l���һP�������Ҥ��i��e���|)�C
�p���������G�O�A�w��C�ӫD�ڪ�����
C
�A��t���@�Ӥ��� P
�AC
��� P
�����e���A�Ӥ�����L�Q
P
�ҥ]�t�����������e���CP
�h�٬� C
��������
(parent or parent element)�A�� C
�h�٬� P
���l����
(child or child element) �C
�@�ӭ�R�L����]�t�奻 (text)�A�奻���@��
�r��(character)�ǦC�A�i�N���ХܩΦr����ơC�@��
�r���O ISO/IEC 10646[ISO/IEC
10646]���w�q���奻�̤p�椸�C�X�k���r���]�A����r�� (Tab)�B�k��r��
(Carriage return)�B����r�� (Line feed) �H�� Unicode �M ISO/IEC 10646
���w�q���X�k�ϧΦr���C����ij�ϥ�[Unicode] 6.8
�`���w�q��"�ۮe�r��(compatibility characters)"�C
�r���d�� (Character Range) |
[2] |
Char |
::= |
#x9 | #xA | #xD | [#x20-#xD7FF] | [#xE000-#xFFFD]
| [#x10000-#x10FFFF] |
/* |
���F�N�ΰϰ� (surrogate block) FFFE �� FFFF �H�~�����N
Unicode �r���C*/ |
|
�N�r���N�X���w���줸���A������A�U���鶡�i�ण�ɬۦP�C�Ҧ���
XML �B�z����������� 10646 ���� UTF-8 �M UTF-16
�s�X�F���w�ϥΦ���ؽs�X���䤤�@�ةΫ��w�ϥΨ�L�s�X������A�N�b�y�᪺"
4.3.3 ���餤���r���s�X "���Q�סC
���`���w�q�F�@�Ǧb��k���s�x�ϥΪ��Ÿ��C
S
(�ť� White space)
�]�A�@�өΦh�ӪŮ�r�� (#x20)�B�k��r���A����r���θ���r���C
�ť� (White Space) |
[3] |
S |
::= |
(#x20 | #x9 | #xD | #xA)+ |
|
���F��K�_���A�r���Q�������r�� (Letters)�A�Ʀr (Digits)
�M��L�r���T���C�r���i�H�O�^��r���������r���A�άO�@�ӭ��`�r��
(Syllabic base character)
�᭱��ۤ@�Φh�ӲզX�r���A�]�i�H�O�@�Ӫ��N�r�� (Ideographic
character)�C�b"B. �r��������"���|�����C���r��������w�q�C
�W��(name)�O�H�r���άY�Ǽ��I�Ÿ��r���}�Y���ŰO(token)�A�᭱�|���ۦr���B�Ʀr�B�s�r���B���u�B�_���Υy���A�o�DzŸ��κ٬��W�٦r��(Name
character)�C�H"xml
"�Ψ�L����۲ũ� (('X'|'x')
('M'|'m') ('L'|'l'))
���r��}�Y�W�١A�b�������Ϋ������W��Ѥ��Q�O�d�ϥΡC(Ķ��:
���ܦW�٦r������H xml�AXml�A...XML ���}�Y)
�`�N�GXML �W�٤����_���Q�O�d���W�٪Ŷ� (name space)
���չ���ɨϥΡC�����N�q�������ݥ��ӦW�٪Ŷ����W��зǤơA�Ө��ɱN�_���Ω����γ~�����i��ݭn��s�C(���O�ҥ���
XML ���W�٪Ŷ�����A�|�ĥΫ_���@���w�ɲšC)��ڤW�A�o�N�۰��D�b���զW�٪Ŷ����չ���ɨϥΡAXML
���@�̤����Ӧb XML �W�٤��ϥΫ_���A�� XML
�B�z�����ӱ����N�_�������@�ӦW�٦r�� (Name Character)�C
Nmtoken
(�W�ٰO�šAname token)
�O����W�٦r�����V�X��C
�W�٩M�O�� (Names and Tokens) |
|
�r����� (Literal data)
�O����ϥΤ��A�_�Ӫ��r��A�����]�A�Ψӧ@�w�ɲ� (Delimiter)
�����C�r����ƥΨӫ����������骺���e (EntityValue
)�B�ݩʭ�
(AttValue
)�H�Υ~���ѧO�r (SystemLiteral
)�C�`�N�G��� SystemLiteral
���y�k���R���ݱ��y�ХܡA
�]����@��R�C
�r����� (Literals) |
[9] |
EntityValue |
::= |
'"' ([^%&"] | PEReference
| Reference)* '"' |
|
|
|
| "'" ([^%&'] | PEReference
| Reference)* "'" |
[10] |
AttValue |
::= |
'"' ([^<&"] | Reference)*
'"' |
|
|
|
| "'" ([^<&'] | Reference)*
"'" |
[11] |
SystemLiteral |
::= |
('"' [^"]* '"') | "'" [^']* "'")
|
[12] |
PubidLiteral |
::= |
'"' PubidChar* '"' | "'"
(PubidChar - "'")* "'" |
[13] |
PubidChar |
::= |
#x20 | #xD | #xA | [a-zA-Z0-9] | [-'()+,./:=?;!*#@$_%] |
|
�奻���r������M�ХܲV�X�c���C�Х��]�A�_�l�����B���������B�Ť�������(Empty-element tags)�B����Ѥ�(Entity references)�B�r���Ѥ�(Character
references)�B�����BCDATA �q(CDATA
section delimiters)�w�ɲšA��������ŧi(Document type
declarations) �M�B�z�����C
�Ҧ��D�Хܪ��奻�զ�����r������C
" And " �Ÿ� (&) �M���T���A�� (<) �u��
�@���Хܩw�ɲšA�Φb�����B�B�z�����A��CDATA�q���ɤ~��H�r����ƧΦ��X�{�C���̦b�@�Ӥ�������ŧi���r����ƹ���ƭ����]�O�X�k���A�Ѩ�"4.3.2 �Φ��X�k����R�L����"�C�p�G�b��L�a��ݭn�ϥΨ즹��r���A���̥������Ʀr�r���Ѥ������� (escaped)
���N�Τ��O�Φr�� "&
" �M "<
"
�Ӫ��ܡC�k�T���A��(>)�i�H�� ">
"
�r��Ӫ��ܡA�ӷ����X�{�b��e��"]]>
"
�r�ꤤ�A�Ӧ��r��ä��N���@��CDATA �q�������w�ɲŮɡA���F�ۮe�ʪ��Ҷq�A�����ϥ� ">
"
�Τ@�Ӧr���ѤިӸ��楻�N (����q)�C
�b���������e���A�r����ƬO���i�]�A����Хܪ��_�l�w�ɲŤ����N�r��C�b�@��
CDATA�q���A�r����ƫh�����]�A CDATA �q�����w�ɲ�"]]>
"�����N�r��C
���F���\�b�ݩʭȤ��]�t����M�����A�ٲ��Ÿ��κٳ��
(')�i�H�Q���ܬ� "'
"�A������ (")
�i�H�Q���ܬ� ""
"�C
�r����� (Character Data) |
[14] |
CharData |
::= |
[^<&]* - ([^<&]* ']]>' [^<&]*) |
|
�����i�H�X�{�b���L�Х��~�������m�W�C���~�A���̥i��m�b��������ŧi����k�Ҥ��\�X�{����m�C���̤��O����r��������@�����AXML�B�z���i�H�A�����������ѡA���@�����ί���˯��X���Ѥ�r�C�w��ۮe�ʪ��Ҷq�A�r�� "--
" (���s�r��)
����b���Ѥ��X�{�C
���� (Comments) |
[15] |
Comment |
::= |
'<!--' ((Char - '-') | ('-' (Char - '-')))* '-->' |
|
���Ѫ��@�ӨҤl�G
<!-- declarations for <head> & <body> --> |
�B�z���� (PIs)���\�����]�t�������O�C
�B�z���� (Process Instructions) |
[16] |
PI |
::= |
'<?' PITarget (S
(Char* - (Char* '?>' Char*)))?
'?>' |
[17] |
PITarget |
::= |
Name - (('X' | 'x') ('M' | 'm')
('L' | 'l')) |
|
PI �ä��O����r��������@�����A�������ǻ������ε{���B�z�CPI
�H�@�ӥؼЦW��(PITarget
)���}�Y�A���ؼЦW��
(target) �O�Ψӿ�O���ܩҫ��V�����ε{���A�ؼЦW��"XML
"�A"xml
"�A�����A�O�d�ΩW�d���������Ϋ������зǤơCXML�O�k (notation)����i�H�Ω� PI �ؼЪ��Φ��ƫŧi�C
CDATA�q�����m�b����r����ƥi�X�{����m�W�A���̥ΨӱN�|�Q�ѧO���Хܦr�ꪺ��r�϶����楻�N
(Ķ��:�N�� CDATA �q�����Хܸ�Ƥ��|�Q�����Х�)�CCDATA�q�H"<![CDATA[
"�r�갵���}�l�A�H"]]>
"�r�갵�������G
CDATA �q (CDATA Sections) |
|
�b�@�� CDATA �q���A�u��CDEnd
�r��|�Q�ѧO���ХܡA�]�����T���A���M"&"
�Ÿ�����H���̪��r����ƧΦ��X�{�A���ݭn (�]����) �ϥ� "<
"
�M "&
" ��r��Ӹ��楻�N (Ķ��:
�]���i�����ϥΥ��̪��r����ƧΦ�)�CCDATA�q����ϥα_�����c�C
�@��CDATA�q���Ҥl�A�䤤"<greeting>
"�M"</greeting>
"�Q�ѧO���r������A�ӨëD�Х��G
<![CDATA[<greeting>Hello, world!</greeting>]]> |
XML���i�H�B���ӥѤ@��XML�ŧi�������}�Y�A�䤤�����ϥΪ�
XML �����C �Ҧp�A�H�U�O�@�ӧ��㪺 XML���A���O�Φ��X�k���A�����O���T�X�k���G
<?xml version="1.0"?>
<greeting>Hello, world!</greeting>
|
�U�����Ҥ]�P�˦p���G
<greeting>Hello, world!</greeting>
|
�����s�� "1.0
"�O�ΨӪ��ܸӤ��ŦX���������W��ѳW�w�A�p�G��ϥΪ����s��
"1.0
" ���L�ä��ŦX���������W��ѡA�h�|�����~�CXML
�u�@�խp���}�o���W��Ѫ������A�ӸӪ����s���N�|���P��"1.0
"
(Ķ��: �i�ର 1.1 �� 1.2)�A���o�ä����ܤ@�w�|�}�o�����A�]�����ܦp�G���F�����A�|�ϥΥ���S�������s�����R�W�覡�C�ѩ�ä��ư����������i��A�]�����ѥ��غc
(Construct)
�@���@���ݭn�ɯ�۰��ѧO��������k�C���B�z�������������Ҥ����B�z�����䴩�������ɡA�|�e�X�@�ӿ��~�T���C
XML��Хܪ��\��O�y�z����x�s�榡�M�赲�c�A�ñN�ݩʻP�Ȳ�(Attribute-value
pairs) �M�赲�c�����p�CXML���Ѥ@����������ŧi
(Document type declaration)
������A�Ψөw�q�赲�c������A�ä䴩�ϥιw���w�q�x�s�椸�C�p�G�@�� XML
���������������ŧi�åB���`�䤤�Ҵy�z������A�h�٦����O���T�X�k��
(valid)�C
��������ŧi���������Ĥ@������ (Ķ��:
�Y�ڤ���) ���e�C
XML��������ŧi�]�t�Ϋ��V�Хܫŧi�A���Хܫŧi���ѬY�@�����k�C���ؤ�k�Q�٬���������w�q
(Document type definition�ADTD)�C��������w�q�i�H���V�@�ӥ]�t�Хܫŧi���~���l��
(�@�دS���������~������)�A�Υi�H�b�@�Ӥ����l���������]�t�Хܫŧi�A�Ψ�̲V�X�ϥΡC�@�Ӥ���榡�w�q�Ѧ���l���X�@�P�զ��C
�Хܫŧi�i�H�O���������ŧi(Element
type declaration)�B�ݩʪ��ŧi(Attribute-list declaration)�B����ŧi�άO�O�k�ŧi�C�o�ǫŧi�i�H�����γ����a�]�t�b�Ѽƹ������A�p�P���U�ӭn�������Φ��X�k��
(well-formedness) �M���T�X�k�� (valid) ������A���㪺��T�Ѩ�"4. ���z���c"�C
��������w�q (Document Type Definition) |
|
�Хܫŧi�i�H�����γ����a���Ѽƹ������m���奻 (replacement text)
�Ҳզ��C���W��ѵy��ӧO�D�ݲŸ�(elementdecl
�AAttlistDecl
�A����)
�����ͳW�h���|�y�z�N�Ҧ��Ѽƹ���Q�]�t(include)�������ŧi�C
���T�X�k�ʭ���: �ڤ������� (Root Element Type)
��������ŧi����Name
�����۲��ڤ����������C
���T�X�k�ʭ���: �Y�檺�ŧi / PE �_�����c
�Ѽƹ��骺�m���奻�����μХܫŧi�Y��a�ϥα_�����ǨӱƦC�C�]�N�O���A�p�G�@�ӼХܫŧi
(�W����markupdecl
)
���Ĥ@�ӡA�Ϊ̳̫�@�Ӧr���Q�]�t��@���Ѽƹ���Ѥ����m���奻���A��̥������]�t�b���m���奻���C
�Φ��X�k�ʭ���: �����l������ PEs
�b���� DTD �l�����A�Ѽƹ���Ѥ��u��X�{�b�Хܫŧi�i�H�X�{���a��A�Ӥ���b�Хܫŧi�����X�{�C(�o�ӭ���A�Ω�X�{�b�~���Ѽƹ��餺���ѤޡA�]���A�Ω�~���l���C)
�p�P�����l���@�ˡA�~���l���M����DTD���Ѥު��~���Ѽƹ���A�����Ѥ@�t�C�D�ݲŸ�markupdecl
�Ҥ��\������Хܫŧi�Ҳզ��A�䤤�i�H�V���ťզr�����Ѽƹ���Ѥ��C�M�ӡA�~���l���M�~���Ѽƹ��骺�������e�i�H�g�Ѩϥ�����q (conditional section)������a�N�������A�b�����l�����h�����\�o���ʧ@�C
�~���l�� (External Subset) |
|
�~���l���M�~���Ѽƹ���P�����l���٦����P���B�b��G�Ѽƹ���Ѥ����ȥu��X�{�b�Хܫŧi�����A�]���\�X�{�b�Хܫŧi�����C
�H�U�O�@�Ӿ֦���������ŧi�� XML���Ҥl�G
<?xml version="1.0"?>
<!DOCTYPE greeting SYSTEM "hello.dtd">
<greeting>Hello, world!</greeting>
|
�t���ѧO�r (system identifier) "hello.dtd
"���ѤF���
DTD �� URI�C
�]�i�p�P�U���Ҥl�@�˦b�P�Ӥ��W (locally) �������ѫŧi�G
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE greeting [
<!ELEMENT greeting (#PCDATA)>
]>
<greeting>Hello, world!</greeting>
|
�p�G�P�ɨϥΥ~���M�����l���A�����l���|�b�~���l�����e�o�͡A�o���ܤ����l����������M�ݩʦC���ŧi���u�����ǭn��~���l�������C
�����qXML �B�z���ǻ������ε{���ӳB�z�ɡA�Хܫŧi�|�v�T�������e�A�ݩʹw�]�ȩM����ŧi�N�O�䤤���Ҥl�C�W�ߤ��ŧi��
XML �ŧi���@�����A������X�������O�_�s�b�~�����ŧi�C
�W�ߤ��ŧi (Standalone Document Declaration) |
[32] |
SDDecl |
::= |
S 'standalone' Eq
(("'" ('yes' | 'no') "'") | ('"' ('yes' | 'no')
'"')) |
[ |
VC: �W�ߤ��ŧi ] |
|
�b�@�ӿW�ߤ��ŧi���A�]�w��"yes
"�����������S���~�����Хܫŧi (���O�b DTD
�~���l�����A�٬O�q�����l�������~���Ѽƹ���Ѥ�)�A�p���|�v�T�q
XML �B�z���ǻ������ε{������T�C�]�w��"no
"���ܦ��Υi��s�b�~���Хܫŧi�C�Ъ`�N�W�ߤ��ŧi�u�O���ܥ~���ŧi���s�b�A�p�G��s�b��~���������ޥΡA�ӷ��o�ǹ���b�����ŧi�ɡA�ä��v�T��W�ߪ��A�C
�p�G�S���~���Хܫŧi�A�W�ߤ��ŧi�S���N�q�C�p�G���~���Хܫŧi�A���S���W�ߤ��ŧi�A�h���w�]�w�Ȭ�
"no
"�C
����֦�standalone="no"
�]�w�� XML
���i�q�L�t��k�N���ഫ���W�ߤ��C�ӬY�Ǻ����ǿ����ε{���i��ݭn�W�ߪ����A
���T�X�k�ʭ��� : �W�ߤ��ŧi
�W�ߤ��ŧi�����N�ȳ]�w�� "no
"�A�p�G����~���Хܫŧi���]�t�G
- ���w�]�Ȫ��ݩʫŧi�A�p�G�M�γo���ݩʪ������X�{�b��ӨS�������o���ݩʳ]�w�Ȫ��ܡA��
- ���� (���F
amp
�Alt
�Agt
�Aapos
�Aquot
�����餧�~)
�Ѥ��X�{�b����ܡA��
- �ݭn�W�d�����ݩʭȫŧi�A�p�G�o�ǥX�{�b����ݩʭȡA�|�]���W�d�Ʀӧ��ܪ��ܡA��
- �㦳���������e�����������ŧi�A�p�G�b�o�����������@��Ҥ������X�{�ťժ��ܡC
�㦳�W�ߤ��ŧi�� XML�ŧi�Ҥl�G
<?xml version="1.0" standalone='yes'?> |
�b�s�� XML ���ɡA�ϥ�"�ť�"(�Ů�B����r���ΪŦ�A�b���W��Ѥ��ΫD�ݲŸ�S
�Ӫ���)
�ӱN�Хܤ��j�H�W�i�iŪ�ʬO�ܤ�K���C�@����i��I������
(delivered version)
���ä��Q�n�]�A�o�ǪťաC�t�@�譱�A�b�i��I�������������O�d���N�q���ťզr���]�O�Z�`�����A�Ҧp�b�ֺq�έ�l�X�����ťզr���C
XML �B�z���`�O�����N�Ҧ����O�Хܪ��r���ǰe�����ε{���C�@�����ҥ��T�X�k�� XML �B�z�������P�ɳq�����ε{���b�o�Ǧr�����A���Ǧr���զ��F�X�{�b�������e�����ťաC
�i�b���������[�@�ӦW�٬�xml:space
���S���ݩ��A�H�q�����ε{�����ӫO�d�����������ťաC�b���T�X�k����A���ݩʩM��L�ݩʤ@�ˡA�ϥήɥ������ŧi�C�ŧi�ɥ������Q�]�w���C�|����
(enumerated type)�A�������u��"default
"�M"preserve
"��ӥi��ȡC�Ҧp�G
<!ATTLIST poem xml:space (default|preserve) 'preserve'> |
"default
"
���ܦ������i�H�����ϥ����ε{�����w�]�ťճB�z�Ҧ��A"preserve
"�������ε{���|�N�Ҧ����ťիO�d�C���ݩʷ|�M�Ω�ҳ]�w���������e���Ҧ������A���D�Q�t�@��xml:space
�ݩʪ��]�w�ȩҨ��N�C
�������ڤ����ä��n�D���ε{�����ťճB�z�覡�A���D�����ѵ����ݩʳ]�w�ȡA�αN���ݩʫŧi���w�]�ȡC
XML��R�L�����g�`�|�x�s�b�q���ɮפ��A�B���F�s�誺��K�A�|�H�檺�覡�Ӳ�´�C�@��o�Ǧ�|�ϥ��k��r��(#xD)�M����r��(#xA)
���զX�Ӱ����j�C
���F²�����ε{�����u�@�A���@�ӥ~����R�L����Τ�����R�L���骺�r����ƹ���Ȥ��]�t�������r���r����ƧǦC"#xD#xA"�γ�W���r�����#xD�AXML�B�z����������#xA�ǻ������ε{���C(�o�i�H�b�i���R�e�N�Ҧ�����j�Ÿ��W�d��#xA�Ӥ�K�a��{�C)
�b�i����B�z�ɡA�q�`���O�n���ѥX�䤺�e�ҨϥΪ��۵M�Υ������y���C�i�H�b����J�@�ӦW��
xml:lang
���S���ݩ��A���ݩʥΩ���X XML
����������e�M�ݩʩҨϥΪ��y���C�b���T�X�k����A�M��L�ݩʤ@�ˡA�ϥΦ��ݩʮɥ������ŧi�C���ݩʪ��]�w�ȬO�b[IETF RFC
1766]�A"���F���ѻy��������"���w�q���y���ѧO�r�G
�y������ (Lang Identification) |
[33] |
LanguageID |
::= |
Langcode ('-' Subcode)* |
[34] |
Langcode |
::= |
ISO639Code | IanaCode | UserCode |
[35] |
ISO639Code |
::= |
([a-z] | [A-Z]) ([a-z] | [A-Z]) |
[36] |
IanaCode |
::= |
('i' | 'I') '-' ([a-z] | [A-Z])+ |
[37] |
UserCode |
::= |
('x' | 'X') '-' ([a-z] | [A-Z])+ |
[38] |
Subcode |
::= |
([a-z] | [A-Z])+ |
|
Langcode
�i�H�O�p�U�]�w�ȡG
- ��[ISO 639]�A"���ܻy���W�٪��N�X"���w�q��Ӧr�����y���X�C
- �b Internet Assigned Numbers Authority [IANA]���U���y�����ѽX�A�ϥ�"
i-
"(��"I-
")���e�m�r
(prefix) ���}�Y�C
- �ϥΪ̦ۭq�θg�ѦU��P�N���M�λy���ѧO�r�A�����ϥ� "
x-
"��"X-
"
���e�m�r���}�Y�A�H�O�ҥ��̤��|�M���Ӹg�� IANA �зǤƩΦb IANA
���U���W�٬۽Ĭ�C
�i�H�����N�h���l�N�X(Subcode)
�Ϭq�A�p�G�s�b�Ĥ@�Ӥl�N�X�Ϭq�A�åB�l�N�X�Ѩ�Ӧr���զ��A�h���l�N�X�����O[ISO3166]�A"���ܰ�a�W�٪��N�X"���w�q����a�N�X�C�p�G�Ĥ@�Ӥl�N�X�h���Ӧr���A�h�������O�b
IANA ���U�y�����l�N�X�A���DLangcode
�O�ϥ�"x-
"��"X-
"�e�m�r���}�Y�C
�ߺD�W�y���N�X�|�ϥΤp�g�r���A��a�N�X (�p�G������)
�|�ϥΤj�g�r���C�Ъ`�N�o�ǭȻP XML
���L�W�٤��P�A���̬O�P�j�p�g�L�����C
�|�Ҧp�U�G
<p xml:lang="en">The quick brown fox jumps over the lazy dog.</p>
<p xml:lang="en-GB">What colour is it?</p>
<p xml:lang="en-US">What color is it?</p>
<sp who="Faust" desc='leise' xml:lang="de">
<l>Habe nun, ach! Philosophie,</l>
<l>Juristerei, und Medizin</l>
<l>und leider auch Theologie</l>
<l>durchaus studiert mit hei��m Bem��'n.</l>
</sp> |
xml:lang
���ܩҫ��w���y���]�w��M�Ω�ҳB�������Ҧ��ݩʩM���e�A���D�Q���e�����������t�@��xml:lang
�ݩʪ��]�w�ȩҨ��N�C
�@��²�檺xml:lang
�ŧi�i�H�ĥΦp�U�Φ��G
xml:lang NMTOKEN #IMPLIED |
�M�ӭY�b�A�������p�U�]�i�H���w�S�w���w�]�ȡC�b�@�����^��ǥͨϥΪ��k��ֺq�ﶰ���A����
(glosses) �M���� (notes) �ϥέ^�y�A�h xml:lang�ݩʥi�H�p�U�C�覡�ŧi�G
<!ATTLIST poem xml:lang NMTOKEN 'fr'>
<!ATTLIST gloss xml:lang NMTOKEN 'en'>
<!ATTLIST note xml:lang NMTOKEN 'en'> |
�C��XML����]�t�@�өΦh�������A�o�Ǥ�������ɨϥ��_�l�����M�����������j�A�Ϊ̹���������ӻ��A�ϥΤ@���Ť��������Ӥ��j�C�C�@�Ӥ����ϥΦW�٨ӿ��Ѻ����A�o�ǦW�٦��ɺ٬�������"�q���ѧO�r
(generic identifier)"(GI)�A�P�ɥ��i�H���@���ݩʭȳ]�w (attribute
specification)���C�C�@���ݩʭȳ]�w���@���W���M�@���]�w���C
���F���Ƕ}�Y�۲� (('X'|'x')('M'|'m')('L'|'l'))
���r��A�b�������Ϋ������W��Ѥ��Q�O�d�ϥΥ~�A���W��Ѥ��露�������M�ݩʪ��y�q�A�Ϊk�M�W��
(�y�k���~) ������C
�Φ��X�k�ʭ���: ���������۲�
�����������Ҥ����W��
�����M�_�l���Ҥ������������۲šC
���T�X�k����: �������T�X�k��
�p�G���@�ӻPelementdecl
�۲Ū��ŧi�W��
�P���������۲ťB�U�z���@�����߮ɡA�h�٦������O���T�X�k���G
- ���ŧi�P
EMPTY
�۲šA�P�ɦ������S�����e�C
- ���ŧi�P
children
�۲šA�P���l�������ǦC�ݩe�ҫ��������h�B�⦡�Ҳ��ͪ��y���A�b�C��l���������\���ť�(�۲ūD�ݲŸ�S
���r��)�C
- ���ŧi�P
Mixed
�۲šA�åB���e�Ѻ����۲ũe�ҫ����W�٪��r������M�l�����զ��C
- ���ŧi�P
ANY
�۲šA�åB�����l�������������w�g�ŧi�C
�C�Ӥ��O�Ū� XML �����ϥΤ@���_�l�����@���}�l�ХܡC
�_�l���ҩM�������Ҥ���Name
���Ѥ����������CName
-AttValue
��Q�٬��������ݩʭȳ]�w�A�䤤�C�@�襤��Name
�Q�٬��ݩʦW���AAttValue
�����e(�b'
��"
�w�ɲŤ�������r)
�Q�٬��ݩʭ��C
�Φ��X�k�ʭ���: �ߤ@���ݩʭȳ]�w
�@���ݩʦW�٥u��b�P�@�Ӱ_�l���ҩΪŤ������Ҥ��X�{�@���C
���T�X�k����: �ݩʭȺ���
�ݩʥ����Q�ŧi�A��ȥ����O�㦳�ŧi�������C(�ݩʺ����Ѩ�"3.3 �ݩʪ��ŧi"�C)
�Φ��X�k�ʭ���: �L�~������Ѥ�
�ݩʭȤ���]�t��~�����骽���ζ���������ѤޡC
���T�X�k�ʭ���: �b�ݩʭȤ��S��<
�b�@���ݩʭȤ������ζ�������Ѥު��m���奻
(���F"<
")����]�t<
�C
�_�l���Ҫ��@�ӨҤl�G
<termdef id="dt-dog" term="dog"> |
�C�ӥѤ@�Ӱ_�l���Ҷ}�l�����������ϥΤ@�����������Хܨ䵲���A�������Ҥ����W�٥����P�_�l���Ҥ����������������ۦP�G
�������� (End-tag) |
[42] |
ETag |
::= |
'</' Name S? '>' |
|
�������Ҫ��@�ӨҤl�G
�b�_�l���ҩM�������Ҥ����奻�Q�٬����������e�G
���������e (Content of Elements) |
|
�p�G���������e�O�����A�������Q���ܬ��@�Ӱ_�l���Һ��@�ӵ������ҩΪŤ������ҡC�Ť��������ĥΤ@�دS�����Φ��G
�Ť������� (Tags for Empty Elements) |
|
���פ����O�_������rEMPTY
�ӫŧi�A�Ť������ҳ��i�H�Ω����S�����e�������C�Y�w��q�ϥ��A�h�Ť��������Ω�B�u��Ω��ŧi��EMPTY
�������C
�Ť������Ҥl�G
<IMG align="left"
src="http://www.w3.org/Icons/WWW/w3c_home" />
<br></br>
<br/> |
���F���� (validation)
���ت��A�i�H�ϥΤ��������M�ݩʪ��ŧi�ӭ���XML��������������c�C���������ŧi����F���������e�C
���������ŧi�q�`����F�l�����i�H�X�{�������C�ѨϥΪ̿�ܡA���ŧi���쪺���������S���۹������ŧi�ɡAXML
�B�z���i�H���Xĵ�i�A���o�ä��O�@�ӿ��~�C
���������ŧi�Φ��p�U�G
���������ŧi (Element type declaration) |
|
�䤤Name
�]�w�F�ҫŧi�����������C
���T�X�k�ʭ���: �ߤ@�����������ŧi
���������u��ŧi�@���C
���������ŧi���Ҥl�G
<!ELEMENT br EMPTY>
<!ELEMENT p (#PCDATA|emph)* >
<!ELEMENT %name.para; %content.para; >
<!ELEMENT container ANY> |
���Y�@�����������u��]�t�l����(�L�r�����)�A�B�i��Ϊť� (�۲ūD�ݲŸ�S
) �Ӱ����j�ɡA�٦����������㦳���������e�C�b�o�ر��p�U�A�o����]�t�F���e�ҫ��A���e�ҫ��O�Ψӱ���l�����i�X�{�������M�l�����i�X�{���Ǫ��@��²���k�C����k�Τ��e�ɤl(Content Particles�Acp
)�ӫغc�A���e�ɤl�ѦW�١A���e�ɤl����ܪ�(choice
list)�Τ��e�ɤl���ǦC��(sequence list)�զ��G
���������e���ҫ� (Element-content Models) |
|
�䤤�C��Name
�O�i�H�X�{���l�������������C����b��ܪ����X�{�����e�ɤl�b���������e�����\�X�{����m�������ܪ��b��k������m�C�ǦC�����X�{���Ҧ����e�ɤl�����H�ۦP�����ǥX�{�b���������e���C�b�W�٩ΦC�����᪺�i��r��
(optional character) �M�w�F���������Τ��e�ɤl�i�H�X�{�@���Φh��(+
)�A�٬O�s���Φh��(*
)�A�άO�s���Τ@��(?
)�C�Y�S���ϥΦp�����ާ@�Ÿ����ܤ����Τ��e�ɤl������n�X�{�@���C�o�ػy�k�M�N�q�M���W��Ѥ������ͳW�h�����ҨϥΪ��ۦP�C
�u�������������e�i�H�z�L���e�ҫ����l�ܸ��|�A�ο��u�ǦC�A��ܻP���ƾާ@�Ÿ��A�åB���e�����C�@�Ӥ����P���e�ҫ������@�ؤ��������۲ŮɡA�h�����������e�P�Ӥ��e�ҫ��۲šC�w��ۮe�ʪ��Ҷq�A�Y��Y�Ӥ����i�H�P���e�ҫ����������������u�@���۲šA�h�|�o�Ϳ��~�C��ԲӪ���T�Ѩ�"E. �T�w�����e�ҫ�"�C
���T�X�k�ʭ���: �Y�檺�s��/PE�_�����c
�Ѽƹ��骺�m����r�Y��a�H�_�����c�ϥάA���Ӳզ��C�o�N�O���A�p�Gchoice
�Aseq
��Mixed
�զ���r���}�l�ε����A���X�{�b�Y���Ѽƹ������m����r���A�h��̥����]�t�b�P�@�Ӹm����r���C��q�ʦҶq�A�p�G�@�ӰѼƹ���ѤޥX�{�bchoice
�Aseq
��Mixed
�զ���r���ɡA�����m����r�����Ӭ��šA�P�ɨ�m����r���Ĥ@�өM�̫�@�ӫD�Ŧr���������@�ӳs���Ÿ�
(|
��,
)�C
�H�U�O���������e�ҫ�����ҡG
<!ELEMENT spec (front, body, back?)>
<!ELEMENT div1 (head, (p | list | note)*, div2*)>
<!ELEMENT dictionary-body (%div.mix; | %dict.mix;)*> |
���Y�����������i�H�]�t�r����ơA�B�䶡�i�H���N���J�l�����ɡA�٦����������㦳�V�X�����e�C�b�o�ر��p�U�A��l�����������i��ҭ���A���ﶶ�ǩM�X�{���ƫh�õL����G
�V�X�����e�ŧi (Mixed Content) |
|
�䤤Name
�����l�����i�X�{�����������C
���T�X�k�ʭ���: �L��������
�P�@�W�٦b��ӲV�X�����e�ŧi���u��X�{�@���C
�V�X���e�ŧi���Ҥl�G
<!ELEMENT p (#PCDATA|a|ul|b|i|em)*>
<!ELEMENT p (#PCDATA | %font; | %phrase; | %special; | %form;)* >
<!ELEMENT b (#PCDATA)> |
�ݩ��O�Ω�N�@��W�ٻP�� (name-value pair)�M�������p�_�ӡC�ݩʭȳ]�w�u��b�_�l�����M�Ť����������X�{;
�]���A�Ω��ѧO���̪����ͳW�h���|�b"3.1 �_�l���ҡB�������ҩM�Ť�������"���X�{�C�ݩʪ��ŧi�i�H�Ω�G
�ݩʪ��ŧi�]�w�F���w�������������p���C���ݩʤ����W�١A��������M�w�]��
(�p�G������)�G
�ݩʪ��ŧi (Attribute-list Delcaration) |
|
AttlistDecl
�W�h��Name
�O�����������C�ѨϥΪ̿�ܡA���ݩʫŧi���������������èS���Q�ŧi�ɡAXML
�B�z���i�H�o��ĵ�i�A���o�ëD�O�ӿ��~�CAttDef
�W�h����Name
�O�ݩʪ��W�١C
�����w����������AttlistDecl
�W�L�@�ӮɡA�o�ǫŧi�����e�|�Q�X�ְ_�ӡC�����w�����������P�@���ݩʪ��w�q�W�L�@�ӮɡA�|�s����Ĥ@�өw�q�A���᪺�w�q�|�Q�����C��ʩʪ��Ҷq�ADTD
�����g�̥i��|��ܹ�w�����������A�̦h���@���ݩʪ��ŧi�A�@�ӵ��w���ݩʦW�ٳ̦h�@���ݩʩw�q�A�H�ΨC���ݩʪ��ŧi�̤֦��@���ݩʩw�q�C��ʩʪ��Ҷq�A�����w�������W�L�@�Ӫ��ݩʪ��ŧi�ε��w�ݩʦ��W�L�@�Ӫ��ݩʩw�q�ɡAXML
�B�z���i�H�̷ӨϥΪ̿�ܵ���ĵ�i�A���L�o�ëD�O�ӿ��~�C
XML �ݩʦ��T�������G�r�������B�@�ղŰO�� (tokenized) �����M�C�|
(enumerated) �����C�r�������i�H�ϥΥ��N�r����Ʀr�ꬰ��;�U�ӲŰO�����������P�����J�k�M�y�N����A�p�U�ҥܡG
�ݩ����� (Attribute Types) |
|
�@
���T�X�k�ʭ���: ID
ID
�������ȥ����۲ũ�Name
�����ͳW�h���C�@��
ID �����Ȫ��W�٦b XML ��u��X�{�@��;��Y ID
���ȥ����O�ߤ@��ЧO�������ȡC
���T�X�k�ʭ���: �C���ݩ������@�� ID
�C���ݩ������u��@�� ID �ݩʡC
���T�X�k�ʭ���: ID �ݩʪ��w�]��
ID �ݩʥ������@�ӫŧi��#IMPLIED
��#REQUIRED
���w�]�ȡC
���T�X�k�ʭ���: IDREF
IDREF
�������ȥ����۲ũ�Name
�����ͳW�h���AIDREFS
�������ȥ����۲�Names
�����ͳW�h���F�C�@��Name
�����۲�
XML ��Y�Ǥ��� ID �ݩʪ��ȡF�]�N�O���AIDREF
�������ȥ����۲ŬY��
ID �ݩʪ��ȡC
���T�X�k�ʭ���: ����W��
ENTITY
�������ȥ����۲ũ�Name
�����ͳW�h���AENTITIES
�������ȥ����۲ũ�Names
�����ͳW�h���F�C�@��Name
�����۲�DTD���ŧi������R�������W�١C
���T�X�k�ʭ���: �W�ٲŰO
NMTOKEN
�������ȥ����۲ũ�Nmtoken
�����ͳW�h��;NMTOKENS
�������ȥ����۲ũ�Nmtokens�����ͳW�h���C
�C�|�������ݩ��i�H�b�ŧi���Ѫ��ȦC�������o�䤤���]�w�ȡC����ئC�|�����G
�C�|�ݩ����� (Enumerated Attribute Types) |
|
�@��NOTATION
�������ݩʥi�ѧO�@���O�k�A�b
DTD ���ŧi���A���O�k�ϥά������t�� (system) �M/�Τ��@ (public)
�ѧO�r�A�B�Ω��Ķ���ݩʪ����������C
���T�X�k�ʭ���: �O�k�ݩ�
���������ȥ����P�ŧi���ҥ]�t���O�k�W�٤��@�۲ŦX;�ŧi�����Ҧ��O�k�W�ٳ������ŧi�C
���T�X�k�ʭ���: �C�|
���������ȥ����P�ŧi���]�t��Nmtoken
�O�����@�۲ŦX�C
��q�ʦҶq�A�P�@Nmtoken
�u��b��Ӥ����������C�|�ݩ��������X�{�@���C
�ݩʫŧi���ѬY�ݩʬO�_���n�X�{����T�A�Y���ݥX�{���ܡA�B��S���X�{���ŧi���ݩʮ�
XML �B�z�����p��B�z�C
�ݩʹw�]�� (Attribute Defaults) |
|
�b�@���ݩʫŧi���A#REQUIRED
���ܥ����û������ݩʡA#IMPLIED
���ܤ����ѹw�]�ȡC�p�G�ŧi�J���O#REQUIRED
�A�]���O#IMPLIED
�A�hAttValue
�ȥ]�t�F�ҫŧi���w�]��;����r#FIXED
�W�w���ݩʥ����û����w�]�ȡC�p�G�ŧi�F�@�ӹw�]�ȡA��
XML �B�z���J���ݩʳQ�ٲ��ɡA���ݩʷ|�H�ŧi�ɪ��w�]�Ȧs�b
���T�X�k�ʭ���: �������ݩ�
�p�G�w�]�ȫŧi�ϥ�����r#REQUIRED
�A�h�ݩʪ��ŧi�ҫ������������������������ݩʡC
���T�X�k�ʭ���: �X�k���ݩʹw�]��
�Q�ŧi���ݩʹw�]�ȥ��������Q�ŧi�ݩ����������k����C
���T�X�k�ʭ���: �T�w���ݩʹw�]��
�p�G�Y�ݩʪ��w�]�ȥ�����r#FIXED
�ŧi�A���ݩʪ���ҥ����۲ũ�ӹw�]�ȡC
�ݩʪ��ŧi���Ҥl�G
<!ATTLIST termdef
id ID #REQUIRED
name CDATA #IMPLIED>
<!ATTLIST list
type (bullets|ordered|glossary) "ordered">
<!ATTLIST form
method CDATA #FIXED "POST"> |
�b�N�ݩʭȶǰe�����ε{�������祿�T�X�k�ʤ��e�AXML
�B�z�������̷ӤU�C�N��W�d�ơG
- ��r���Ѥު��B�z�覡�O�N�Q�ޥΪ��r�����[�b�ݩʭȤ���
- �����Ѥު��B�z�O���j�a�B�z���骺�m����r
- ��ťզr�� (#x20�B#xD�B#xA �P #x9) ���B�z�O�N #x20
���[��W�d�ƪ��Ȥ���A�ҥ~�O��@��������R�L����Τ�����R�L����r������Ȥ@������
"#xD#xA" �r���ǦC�u�|���[�@�� #x20�C
- ����L�r�����B�z�O�N���̪��[��W�d�ƪ��Ȥ���
�p�G�Q�ŧi���Ȥ��O CDATA�A�h XML
�B�z�������i�@�B�B�z�W�d�ƫ��ݩʪ��ȡA�h����e�m�M���H���Ů�
(#x20) �r���A�ñN�Ů� (#x20) �r���ǦC��������ӪŮ� (#x20) �r���C
�Ҧ����ŧi���ݩʡA���ӳQ�D�i�����ҭ�R�� (non-validating parser)
�����ŧi��CDATA
�C
����q�O��������ŧi�~���l�����@�����A���̳Q�]�t�b
DTD �赲�c�����A�γQ�ư��b DTD
�赲�c���~�A�ھک��t���̪�����r�C
����q (Conditional Section) |
|
�N�������Υ~�� DTD
�l���@�ˡA����q�i�H�]�t�@�өΦh�ӧ��㪺�ŧi�A���ѡA�B�z���ܡA�α_��������q�A�䤤�i�H�����ťաC
�p�G����q������r�O INCLUDE
�A�h����q�����e�O DTD
���@�����A�p�G����q������r�OIGNORE
�A�h����q�����e���O
DTD
��W���@�����C�w��i�a����R�L�{�ӻ��A�Q����������q���e�����QŪ���A�ت��O���F�˴�����q���_�����c�A�ëO�ү�A���a�˴���̥~�h��
(�Q������) ����q�����C�p�G�@�Өϥ�����rINCLUDE
������q�X�{�b�ϥ�����rIGNORE
����j����q���A���~��ӱ���q���|�Q�����C
�p�G����q������r�O�@�ӰѼƹ���ѤޡA�B�z���b�M�w�O�_�]�t�Ω���������q�e�A�������N�ӰѼƹ���m�����䤺�e�C
�@�ӨҤl�G
<!ENTITY % draft 'INCLUDE' >
<!ENTITY % final 'IGNORE' >
<![%draft;[
<!ELEMENT book (comments*, title, body, supplements?)>
]]>
<![%final;[
<!ELEMENT book (title, body, supplements?)>
]]>
|
�@�� XML
���i��]�t�@�өΦh���x�s�椸�C���̳Q�٬�����(entity);���̳��㦳���e�åB���H�W���Ӱ��ѧO
(���F������M�~�� DTD �l�����~�A�Ԩ��U������)�C�C�@��
XML ����@�Ӻ٬������� (document entity)������A���@��XML �B�z�����B�z�_�I�A�åi�H�]�t�F��Ӥ��C
����i�H�O�w��R������R���C��R�L����(parsed
entity)�����e�Q�٬������m���奻;���奻�Q�ݦ��O�����骺�@�����C
����R����(unparsed entity)�O�@�ظ귽�A�䤺�e�i�H�O�]�i�H���O��r�A�B�Y����r���ܡA�i�H���O XML�C�C�ӥ���R���馳�@�Ӭ������O�k�A���O�k�ϥΦW�٨Ӱ��ѧO�C���F�n�D XML
�B�z����V���ε{�����ѹ���M�O�k���ѧO�r���~�AXML
�良��R���骺���e���@����C
��R�L����H����Ѥު��覡�ϥΦW�٨Ӱ��ޥ�;����R�����ENTITY
��ENTITIES
�ݩʤ��Ҵ��Ѫ��W�٨ӤޥΡC
�q�ι��� (general entity)�O���Ǧb��e���ϥΪ�����C�b���W��Ѥ��A�q�ι��馳�ɷ|�ϥΥ��֥i���N�yentity�Ӫ��ܡC�Ѽƹ���O�Ω�DTD
������R�L����C�o��������Τ��P�Φ����Ѥޤ覡�A�B�b���P���W�U�夤�Q�ѧO�C���~�A���̨ϥΤ��P���W�٪Ŷ�;�㦳�ۦP�W�٪��Ѽƹ���M�q�ι���O�������P����ӹ���C
�@���r���Ѥ��|�ޥ� ISO/IEC 10646
�r���������@�Ӧr���C�Ҧp����ο�J�]�ƪ�����J���r���C
�r���Ѥ� (Character and Entity References) |
[66] |
CharRef |
::= |
'&#' [0-9]+ ';' |
|
|
|
| '&#x' [0-9a-fA-F]+ ';' |
[ |
WFC: �X�k�r�� ] |
|
�@
�Φ��X�k�ʭ���: �X�k�r��
�Φr���ѤޤޥΪ��r�������۲ũ�Char�����ͳW�h���C
�p�G�r���ѤޥH"&#x
"���}�Y�A�B�Ʀr�M�r���᭱���W���Ÿ��Τ���
";
" �A�p�����ѤF�Y�r���b ISO/IEC 10646
���N�X���@�ӤQ���i����ܡC�p�G���ȥH"&#
"�}�Y�A�Ʀr�᭱���W���Ÿ��Τ���
(";
")�A�h���ѤF�Y�r�����N�X���Q�i�Ȫ��ܡC
����Ѥ�(entity reference)�ޥΤ@�ӦW�ٹ��骺���e�C��w��R�q�ι���ޥΨϥ� "and" �Ÿ� (&
)
�M���� (;
)�@���w�ɲšC�Ѽƹ���Ѥ��h�ϥΦʤ���(%
)�M����(;
)�@���w�ɲšC
����ޥ� (Entity Reference) |
|
�@
�Φ��X�k�ʭ���: �ŧi����
�b�@���S������ DTD �����A�Τ@�����]�t�Ѽƹ���ѤޥΪ����� DTD
�l�������A�Τ@��"standalone='yes'
"����A�b����Ѥޤ����Ѫ�Name
�����P����ŧi���Ҵ��Ѫ��۲ŦX�A���F�Φ��X�k����ݭn�ŧi�U�C���o�ǹ���Gamp
�Alt
�Agt
�Aapos
�Mquot
�C�Ѽƹ��饲���b����復���ޥΤ��e�ŧi�C�ۦP�a�A�X�{�b�ݩʪ��ŧi�w�]�Ȥ����q�ι��饲���b����復���ޥΤ��e�ŧi�C�n�`�N�Y�b�~���l���Υ~���Ѽƹ��餤�ŧi������A���i�����Ҫ��B�z�������nŪ���M�B�z���̪��ŧi;���p�������A�u���]�w��standalone='yes'�ɡA���饲���Q�ŧi���W�h�~�O�@�ӧΦ��X�k�ʪ�����C
���T�X�k�ʭ���: �ŧi����
�b�@�Ӧ��~���l���Υ~���Ѽƹ���B�]�w��"standalone='no'
"�����餤�A����Ѥޤ����Ѫ�Name
�����P����ŧi���Ҵ��Ѫ��۲ŦX�C��q�ʦҶq�A���T�X�k��������Өϥ�"4.6 �w�w�q����"���ҭz���Φ��ӫŧi����amp
�Alt
�Agt
�Aapos
�Mquot
�C�Ѽƹ��饲���b����復���ޥΤ��e�ŧi�C�ۦP�a�A�X�{�b�ݩʪ��ŧi�w�]�Ȥ����q�ι��饲���b����復���ޥΤ��e�ŧi�C
�Φ��X�k�ʭ���: ��R�L����
����Ѥޤ���]�t�@������R�������W�١C����R����u��b�ŧi��ENTITY
��ENTITIES
���ݩʭ����ޥΡC
�Φ��X�k�ʭ���: �L���j
��R�L���餣�ઽ���ζ����a�]�t�糧�������j�ޥΡC
�Φ��X�k�ʭ���: �bDTD��
�Ѽƹ���Ѥޥu��bDTD���X�{�C
�r���M����ޥΪ��Ҥl�G
Type <key>less-than</key> (<) to save options.
This document was prepared on &docdate; and
is classified &security-level;. |
�Ѽƹ���ޥΪ��Ҥl�G
<!-- declare the parameter entity "ISOLat2"... -->
<!ENTITY % ISOLat2
SYSTEM "http://www.xml.com/iso/isolat2-xml.entities" >
<!-- ... now reference it. -->
%ISOLat2; |
����ϥΤU�C�覡�ŧi�G
����ŧi (Entity Declaration) |
|
Name
���ѤF�b����Ѥ���������;�ΰw�良��R���骺���p�A���ѤFENTITY
��ENTITIES
�ݩʭȤ�������C�p�G�P�˪�����Q�ŧi�F����@���A�h�|�s����Ĥ@�ӹJ�쪺�ŧi�C�ѨϥΪ̿�ܡA�p�G����Q�h���ŧi�AXML�B�z���i�H���Xĵ�i�C
�p�G����w�q�O�@��EntityValue
�A�Q�w�q������Q�٬����������C��������S����W�����z
(Physical) �x�s����A���骺���e�b�ŧi�����ѡC�`�N�r����������@�ǹ���M�r���Ѥު��B�z�i��n�D���ͥ��T���m����r�G�Ѩ�"4.5 �����m����r���c�y"�C
��������O��R�L�����C
��������ŧi���Ҥl�G
<!ENTITY Pub-Status "This is a pre-release of the
specification."> |
�p�G���餣�O�������A�h���O�@���~�������A�ŧi�p�U�G
�~������ŧi (external entity) |
|
�p�G��NDataDecl
�A�h�����@�몺����R����;�_�h���O�@�ӭ�R�L����C
���T�X�k�ʭ���: �ŧi�O�k
Name
�����P�O�k���W�٬۲šC
SystemLiteral
�Q�٬��ӹ��骺�t���ѧO�r�C�����@��
URI�A�i�H�ΨӦs��������C�`�N���� (#
) �M URI
���`�ϥΪ��ѧO�r���q�b�Φ��W�ëD URI
���@�����F�p�G�Ҵ��Ѫ��ѧO�r���q���t���ѧO�r���@�����A�h XML
�B�z���i�H�e�X�@�ӿ��~�T���C���D�b���W�d�ѽd�~����T�A�Ҵ��Ѫ��ҥ~���p
(�Ҧp�@�ӯS�� DTD ���w�q���S�w�ϥΪ� XML
���������A�Τ@�ӯS�����ε{���W�d���w�q���B�z����)�A�۹� URI
�O���۹�����ŧi�o�ͪ��귽��m�C�]���A�@�� URI �i��۹���������A�ά۹��]�t�~�� DTD
�l��������A�ά۹��@�Ǩ�L���~���Ѽƹ����C
XML �B�z���B�z URI �����D ASCII �r���ɡA���ӱN UTF-8
�����r���Τ@�өΦh�Ӧ줸�ժ��ܡA�M��N�o�Ǧr���ϥ� URI
�������Ӹ��楻�N (�Y���N�C�Ӧ줸���ഫ�� %HH�A�䤤 HH
�O�줸�խȪ��Q���i��O�k)�C
���F�t���ѧO�r���~�A�~���ѧO�r�٥i�H�]�t���@�ѧO�r�C�չϦs�����餺�e��
XML �B�z���A�i�H�ϥΤ��@�ѧO�r�յ۲��ͥt�@�Ӥ��P�� URI�C�p�G�B�z���L�k���즹�I�A�h�������ϥΨt���ѧO�r
(systemLiteral) �ҫ��w�� URI�C�b�չϬ۲Ť��e�A���@�ѧO�r���Ҧ��ťզr�ꥲ���Q�W�d������W���Ů�r��(#x20)�A�P�ɥ����N�e�m�Χ��H�ťղ����C
�~������ŧi���Ҥl�G
<!ENTITY open-hatch
SYSTEM "http://www.textuality.com/boilerplate/OpenHatch.xml">
<!ENTITY open-hatch
PUBLIC "-//Textuality//TEXT Standard open-hatch boilerplate//EN"
"http://www.textuality.com/boilerplate/OpenHatch.xml">
<!ENTITY hatch-pic
SYSTEM "../grafix/OpenHatch.gif"
NDATA gif > |
�C�ӥ~����R�L����i�ϥ��奻�ŧi�@���}�l�C
�奻�ŧi�����H�r���W���Φ��Ӵ��ѡA�Ӥ���z�L��R�L���骺�ޥΡC�奻�ŧi���F��X�{�b�~����R�L���骺�}�Y���~�A�ä����\�b��L�����m�X�{�C
�p�G������۲�document
���ͳW�h���A�h���O�Φ��X�k���C�p�G�~�����q��R�L����۲�extParsedEnt
���ͳW�h���A�h���O�Φ��X�k���C�p�G�~���Ѽƹ���۲�extPE
���ͳW�h���A�h���O�Φ��X�k���C
�W�d���~����R�L���� (Well-Formed Parsed Entity) |
|
�p�G�������q��R�L���骺�m����r�۲�content
���ͳW�h���A�h���O�Φ��X�k���C�ھکw�q�A�Ҧ��������Ѽƹ��鳣�O�Φ��X�k���C
�b���餤�ŦX�Φ��X�k�ʪ����G�O�AXML
�����M���z���c�O�Y��ŦX�_�����c��;�_�l�����A���������A�Ť��������A�����A�����A�B�z�����A�r���Ѥ��A������Ѥ�������b�@�ӹ��餤�}�l�Ӧb�t�@�ӹ��餤�����C
XML
����C�ӥ~����R�L���鳣�i�H���r���ĥΤ��P���s�X�C�Ҧ�
XML �B�z��������Ū�� UTF-8 �� UTF-16 �s�X������C
�H UTF-16 �s�X�����饲���H ISO/IEC 10646 �W�� E �M Unicode ���� B (�s�e�פ����_�Ů�r��
ZERO WIDTH NO-BREAK SPACE�A#xFEFF)���Ҵy�z���줸�ն��ǼХ�(Byte Order Mark)
�}�Y�C�����@�ӽs�Xñ�W�A�Y���O XML ��Хܪ��@�����A�]���O
XML���r����ƪ��@�����CXML �B�z��������ϥΦ��r���ӰϧO UTF-8
�s�X�M UTF-16 �s�X�����C
���M XML �B�z���u�Q�n�D��Ū�� UTF-8 �M UTF-16
�s�X������A���L���@�ɤW�٦��ϥΨ�L���s�X�覡 (Ķ��:
�Ҧp�ꤺ�ϥΪ��c�餤�� Big5 �X) �h�w���@�ѡC���ɥi��|�Q�� XML
�B�z��Ū���H��L�s�X�覡�s�X������C�H���P�� UTF-8 �M UTF-16
���s�X�覡�x�s�����饲���H�]�t�s�X�ŧi���奻�ŧi���}�Y�G
�s�X�ŧi (Encoding Declaration) |
[80] |
EncodingDecl |
::= |
S 'encoding' Eq ('"' EncName '"' | "'" EncName
"'" ) |
[81] |
EncName |
::= |
[A-Za-z] ([A-Za-z0-9._] | '-')* |
/* |
�s�X���W�٥u�]�t�ԤB�r�� */ |
|
�b���������A�s�X�ŧi�OXML�ŧi���@�����CEncName
�O�ҥνs�X���W�١C
�b�@�ӽs�X�ŧi���A��"UTF-8
"�A"UTF-16
"�A"ISO-10646-UCS-2
"�M"ISO-10646-UCS-4
"���ӥΩ����
Unicode�� ISO/IEC 10646 �����U�ؤ��P�s�X�M�ܴ��覡�A��"ISO-8859-1
"�A"ISO-8859-2
"�A...
"ISO-8859-9
"���ӥΩ���� ISO 8859 ���U�ӳ����A�ӭ�"ISO-2022-JP
"�A"Shift_JIS
"�M"EUC-JP
"���ӥΩ����
JIS X-0208-1997 ���U�ؽs�X�CXML �B�z���i�H�ѧO��L�s�X�覡;��ij���b
Internet Assigned Numbers Authority [IANA]���U���r���s�X�覡
(�H�r����(charset)���覡)�A���F�W���ҦC�����~�A�ޥή����ӨϥΨ���U�W�١C�`�N�o�ǵ��U�W�٬O�w�q�����ϧO�j�p�g��
(case-insensitive)�A�]�����P���۲Ū��B�z���n�ϥΤ��Ϥ��j�p�g���覡�C
�b�ʤ֥~���ǿ��w (�p HTTP �� MIME)
�Ҵ��Ѫ���T�ɡA�H�U���p�Ҭ����~�GXML
�B�z�������쪺����s�X�覡�P����ҧt�s�X�ŧi�����X���s�X�覡���P�A�s�X�ŧi���b�~�����骺�}�Y�A�άJ���H�줸�ն��ǼХܶ}�Y�A�]���H�s�X�ŧi�}�Y������ϥΤF���P��
UTF-8 ���s�X�C�`�N�]�� ASCII �OUTF-8 ���@�Ӥl���A�@�몺 ASCII
�r������ä��Y��a�ݭn�s�X�ŧi�C
�� XML �B�z���J�쪺����ϥΤF������B�z���s�X�ɡA�h�|�O���Y�����~�C
�s�X�ŧi���Ҥl�G
<?xml encoding='UTF-8'?>
<?xml encoding='EUC-JP'?> |
�U���w��F�r���ѤޡA����Ѥޤι良��R���骺�s�ΡA�N���J�`�i�H�X�{���W�U��A�H�ΨC�ر��p�UXML �B�z���һݶi�檺�ʧ@�C
�̥���@�檺���Ҵy�z�F�ѧO�ɪ��W�U��G
- ���e�����ޥ�
- �i�H�b�������_�l��������A�����������e������a��H�ޥΧΦ��X�{�A������D�ݲŸ�
content
�C
- �ݩʭȤ����ޥ�
- �i�H�b�_�l���������ݩʭȤ��A���ݩʫŧi�����w�]�Ȥ��H�ޥΧΦ��X�{;������D�ݲŸ�
AttValue
�C
- ���@�ݩʭȮ�
- �i�H�ϥ�
Name
�Өä��O�H�ޥΪ��覡�A�@���ŧiENTITY
�������ݩʭȡA�Υi�H�@���ŧiENTITIES
�������ݩʭȤ����H�ťդ��j���ŰO���@�C
- ����Ȥ����ޥ�
- �i�H�b�ѼƤ��Τ������骺����ŧi���r����������H�ޥΧΦ��X�{;������D�ݲŸ�
EntityValue
�C
- DTD�����ޥ�
- �i�H�bDTD�������Υ~���l�����H�ޥΧΦ��X�{�A�����b
EntityValue
�MAttValue
���~�C
�b DTD ���~�A�ʤ���r��%
�S���S���t�q;�]���b DTD
�����Ѽƹ���Ѥަbcontent
�����Q�����Х��ѧO�C�P�˦a�A���D����R���骺�W�٥X�{�b�w�A���ŧi���ݩʭȤ��A�_�h���̤��Q�ѧO�C
���@�ӹ��骺�m����r�Q�����b�ޥΦ�m�����@�����@�˳Q�s���M�B�z�ɡA�٦������Q�]�t�C��m����r�i�H�]�t�r������M�Х�(���]�A�Ѽƹ���)�A�䤤�Хܥ����ϥΤ@�몺�覡���ѧO�A���Ω���楻�N�Хܩw�ɲ�(����amp
�Alt
�Agt
�Aapos
�Mquot
)������m����r�`�O�Q������ơC(�r��"AT&T;
"�i�}��"AT&T;
"�|�s��"and"�Ÿ�&���Q�ѧO������Ѥު��w�ɲšC)���ҫ����r���Q�����ޥΦ�m����r�@�˳Q�B�z�ɡA�٦��r���Ѥ��Q�]�t�C
�� XML �B�z���ѧO�X�@�Ӱw���R�L���骺�ޥΡA���F�����Ӥ��A�B�z�������]�t�����骺�m����r�C�p�G����O�~�����A�ӳB�z�����չ����Ҹ�
XML���A�h�B�z���i�H�A�����O�����A�]�t�����骺�m����r�C�p�G�@�ӫD���ҭ�R�����]�t���m����r�A�������q���ѧO�X���S��Ū�������骺���ε{���C
�����W�h���@�Ӧ@�ѡG�� SGML �M XML ���������Ѫ��۰ʥ]�t
(Automatic inclusion)
����A�_��O�]�p�ΨӤ䴩�ҲդƳЧ@���A���@�w�A�X���L���ε{���A�S�O�b����s���W�C�Ҧp�A���s�����J��@�ӥ~����R�L����ޥήɡA�i���ܥε�ı�Ƥ覡���ܨ�s�b�A�åB�u�|�b�Q�ШD�ɤ~Ū�����i����ܡC
�U�C�����p�|�Q�T��A�úc���@���Y�����~�G
������ޥ��X�{�b�ݩʭȤ��ΰѼƹ���ޥΥX�{�b�r����ƹ���Ȥ��ɡA���̪��m���奻�Q�����X�{�b�ޥΩҦb��m��@�����@�˳Q�s���M�B�z�A�m���奻�����������`�O�Q�������`����Ʀr���Ӥ��|�������r���W��ơC�Ҧp�A�U�����Ҥl�O�Φ��X�k���G
<!ENTITY % YN '"Yes"' >
<!ENTITY WhatHeSaid "He said &YN;" > |
�ӤU�����Ҥl�h���O�Φ��X�k���G
<!ENTITY EndAttr "27'" >
<element attribute='a-&EndAttr;> |
������R�����W�ٷ����ŰO�b�ŧi��ENTITY
��ENTITIES
�������ݩʭȤ��X�{�ɡA�i�����Ҫ��B�z�������N������M���������O�k���t���M���@(�p�G������)�ѧO�r�q�������ε{���C
������ŧi���@�ӳq�ι���ޥΥX�{�bEntityValue
���ɡA�����|�Q�B�z�B�������ܡC
���p�P�~����R�L����@�ˡA�Ѽƹ���u�ݦb�i�����ҮɳQ�]�t�C���Ѽƹ���ޥΦb
DTD ���Q�ѧO�åB�Q�]�t�ɡA�����m���奻�ǥѫe��U�[�W�@�ӪŮ�r��
(#X20) ���X�j�d��;��ت��b��j��Ѽƹ��骺�m���奻�]�t��ƭ� DTD
������k�O�šC
�b�Q�פ������骺�B�z�ɡA�Ϥ���اΦ�������ȬO�����U���C�r����ƹ����(literal entity value)�O��ڥX�{�b����ŧi���Τ��X�_���r��C������D�ݲŸ�EntityValue
�C�m����r(replacement
text)�O�m���F�r���ѤީM�Ѽƹ���ޥΫ᪺���餺�e�C
�b��������ŧi(EntityValue
)�����Ѫ��r���W��ƹ���ȥi�H�]�A�r���ѤޡA�Ѽƹ���ޥΩM�q�ι���ޥΡC�p�����ޥΥ�����ӳQ�]�t�b�r���W��ƹ���Ȥ��C�p�e�z�覡�Q�]�t����ڸm����r�����]�t�Ҧ��Q�ޥΪ��Ѽƹ��骺�m����r�A�P�ɩҦ��Q�ޥΪ��r�������b�r���W��ƹ���Ȥ��r���ѤީҦb��m�Q�]�t�C���q�ι��骺�ޥΥ����O�����ܡA���Q�i�}�C�Ҧp�A�p�G���H�U���ŧi�G
<!ENTITY % pub "Éditions Gallimard" >
<!ENTITY rights "All rights reserved" >
<!ENTITY book "La Peste: Albert Camus,
© 1947 %pub;. &rights;" > |
�h����"book
"���m���奻���G
La Peste: Albert Camus,
?nbsp;1947 �itions Gallimard. &rights; |
�@���ޥ�"&book;
"�X�{�b����e���ݩʭȤ��ɡA�q�ι���ޥ�"&rights;
"���ӳQ�i�}�C
�o��²�檺�W�h�N�i��|�X�{�������ۤ��@��;�Ѩ�"D. ����M�r���Ѥު��i�}"���|���@�Ӹ����x�����Ҥl���ԲӰQ�סC
����M�r���Ѥ��i�H�Ω��������y�A���A"and"��(&)�M��L�w�ɲšC�q�ι��鶰�X(amp
�Alt
�Agt
�Aapos
�Aquot
)�S�O�w��ت��C�]�i�H�ϥμƭȦr���Ѥ�;
���̤@���Q�ѧO�N�|�ߧY�Q�i�}�A�P�ɥ��̥����Q�����r����ơA�]���ƭȦr���Ѥ�"<
"�M"&
"�i�H�Ω���楻�N�X�{�b�r����Ƥ���<
�M&
�C
���o�ǹ���O�_�Q�ŧi�A�Ҧ��� XML �B�z���������ѧO���̡C��q�ʦҶq�A���T�X�k�� XML
������Ӧp�P��L����@�ˡA�b�ϥγo�ǹ���e���ŧi���̡C�p�G�ŧi���ܡA�o�ǹ��饲���Q�ŧi����������A��m����r�O�Q���楻�N����Ӧr���Ϋ��V�o�Ӧr�����r���ѤޡC�p�U�ҥܡC
<!ENTITY lt "&#60;">
<!ENTITY gt ">">
<!ENTITY amp "&#38;">
<!ENTITY apos "'">
<!ENTITY quot """>
|
�`�N�b"lt
"�M"amp
"���ŧi���A<
�M&
���楻�N�⦸�A�o�O���F��������m�����Φ��X�k�ʭn�D�C
�O�k�ΦW�ټ��ѤF����R�������榡�A�㦳�O�k�ݩʪ��������榡�A�H���B�z�����Ұw�諸���ε{�����榡�C
�O�k�ŧi���ѰO�k�@�ӥi�Ω���餤�A�ݩʪ��ŧi���M�ݩʭȻ��������W�١A�P�ɤ]���ѤF�@�ӰO�k���~���ѧO�r�A�ϱo
XML
�B�z���Υ����Ȥ����ε{���A�i�H�N���w�O�k���B�z��ƪ��U�z���ε{���өw��C
�O�k�ŧi (Notation Declarations) |
|
XML
�B�z�������V���ε{�����ѥ���b�ݩʭȤ��A�ݩʩw�q���ι���ŧi���w�q�ΤޥΪ��O�k���W�٩M�~���ѧO�r�C�����٥i�H�N�~���ѧO�r�ѪR���t���ѧO�r�A�ɮצW�١A�άO���\���ε{���I�s�B�z���B�z�O�k�y�z��ƪ���L�һݸ�T�C(�M��
XML �B�z�������ε{���Ұ��檺�t�Τ��A�S���B�z XML���ŧi�M�ޥΪ��S�w�O�k���ε{���A���ëD�O�@�ӿ��~�C)
������ (document entity)��������𪺮کMXML �B�z�����B�z�_�I�C���W��ѨS���W�w XML
�p��w�������;���P��L���餣�P�A������S���W�١A�ӥB�i�H�������a������Ѧa�X�{�b�B�z������J��Ƭy���C
�X�G�W�d��XML �B�z���i�H���������G�i�����Ҫ��M���i�����Ҫ��C
�i�����ҩM���i�����Ҫ��B�z���������i���b�������M������R�L���������e�A�H�ϥ��W��ѧΦ��X�k�ʭ�����p�C
�i�����Ҫ��B�z�������i���H��DTD�ŧi���ҭz������p�H�Τ��������W��Ѥ����Ѫ����T�X�k�ʭ�����p�C
�n�����o�@�I�A�i�����Ҫ� XML �B�z������Ū���M�B�z��� DTD
�M�Ҧ��b��ޥΪ��~����R�L����C
���i�����Ҫ��B�z���u�Q�n�D�ˬd�������M��Ӥ���
DTD �l�����Φ��X�k�ʡC���M���̤��Q�n�D�ˬd����T�X�k�ʡA���L���̥����B�zŪ�����Ҧ�����
DTD �l�������ŧi�M�Ҧ��Ѽƹ���A����J��Ĥ@���|��Ū�����Ѽƹ���ޥ�;�]�N�O���A���̥����ھڳo�ǫŧi������T�ӱN�ݩʭ��W�d���A�]�t�������骺�m���奻�A�ô����w�]�ݩʭ��C���̦b�J��Ĥ@�ӹ��|��Ū�����Ѽƹ��餧�ޥΫ�A�����B�z��᪺����ŧi���ݩʪ��ŧi�A�]�������餤�]�t���ŧi�i���л\�e�����ŧi�C
�i�����Ҫ��B�z�����欰�O���ץi�w���� (highly predictable)�F������Ū����Ҧ������A�i���Ҧ��H�ϧΦ��X�k�P���T�X�k�����p�C��@�Ӥ��i�����ҳB�z�����n�D�|����C�@�I�F�]�������ݭnŪ��������H�~���������C�o��
XML ���B�z�����ϥΪ̦Ө��A�i��|����ӭ��n���v�T�G
���F�Ϥ��P XML
�B�z���������ֳq���̤j���i�a�ʡA�ϥΤ��i�����Ҫ��B�z�������ε{�������̿�n�D�o�dzB�z����ƪ��ʧ@�C���ǭn�D�ϥΦp�w�]�ȩΦb�~�����餤�ŧi�������鵥�\����ε{�����Өϥζi�����Ҫ�XML�B�z���C
���W��Ѥ� XML ���Φ��Ƥ�k (formal grammar)
�ϥΤ@��²�檺�X�i�ڧJ���榡 (Extended Backus-Naur Form�AEBNF)���X�C��k�����C�@���W�h�w�q�F�@�ӲŸ��A�Φ��p�U�G
�p�G�Ÿ��Υ��W�B�⦡ (Regular expression)
�w�q�A�h���H�j�g�r���}�Y�A�_�h�H�p�g�r���}�Y�C�r��r���W���
(literal strings)���A�_�C
�b�W�h�k�䪺�B�⦡���A�H�U�B�⦡�Ω�۲Ť@�өΦh�Ӧr�����r��G
#xN
N
�O�@�ӤQ���i�쪺��ơA��ISO/IEC 10646���Y�Ӧr�����W�d(UCS-4)�N�X�ȧ@���L�Ÿ��G�i��Ʀr�PN
�۵��ɡA���B�⦡�۲ųo�Ӧr���C#xN
�榡�����e��
0 �èS���N�q�A�b�������N�X�Ȥ����e�� 0
���Ӽƫh�ѩҥΦr���s�X�覡�ӨM�w�A�� XML �S���N�q�C
[a-zA-Z]
�A [#xN-#xN]
- �P��Ȧb���w�d�������r���۲� (�]�t��ɡAinclusive)�C
[^a-z]
�A [^#xN-#xN]
- �P��Ȧb���w�d�����~�������r���۲šC
(Ķ���G[^a-z] ���ܰ��F a �� z ���~������r��)
[^abc]
�A [^#xN#xN#xN]
- �P���b���w�r���������r���۲šC (Ķ���G[^abc]
���ܰ��F abc ���~������r��)
"string"
- �P�۲��������ҵ��r�ꪺ�r���W��Ʀr��۲šC
'string'
- �P�۲�������ҵ��r�ꪺ�r���W��Ʀr��۲šC
�o�DzŸ��i�H���U�C�覡�զX�A�H�۲ŧ�������Ҧ��A�䤤A
�MB
����²��B�⦡�G
- (
expression
)
expression
�Q�����@�ӳ椸�A�i�H�V�����y�z�����˶i��զX�C
A?
- �P�s�өΤ@��
A
�۲šA�YA
�i���i�L�C (Ķ���GA
�i�X�{�@�����X�{)
A B
- �P
A
���B
���Ҧ��۲šC (Ķ���G�X�{���ǥ�����
A �� B)
A | B
- �P
A
B���@�۲šA�����P�ɬ۲šC (Ķ���G�i�X�{ A �� B)
A - B
- �P����۲�
A
�����۲�B
���r��۲šC (Ķ���G�u��X�{
A ����X�{ B)
A+
- �P�@�өΦh��
A
�۲šC (Ķ���GA
�@�w�n�X�{�A�B�i�X�{�h��)
A*
- �P�s�өΦh��
A
�۲šC (Ķ���GA �i���X�{�A�]�i�X�{�h��)
��L�b���ͳW�h�����ϥΪ��O�k���G
/* ... */
- ����
[ wfc: ... ]
- �Φ��X�k����;�ΦW�ټ��Ѥ@�ӹ�P�Y�Ӳ��ͳW�h�������p���Φ��X�k/a>�����C
[ vc: ... ]
- ���T�X�k�ʭ���;�ΦW�ټ��Ѥ@�ӹ�P�Y�Ӳ��ͳW�h�������p�����T�X�k�����C
����
- IANA
- (Internet Assigned Numbers Authority) Official Names for Character Sets�A ed.
Keld Simonsen et al. See ftp://ftp.isi.edu/in-notes/iana/assignments/character-sets.
- IETF RFC 1766
- IETF (Internet Engineering Task Force). RFC 1766: Tags for the Identification of
Languages�A ed. H. Alvestrand. 1995.
- ISO 639
- (International Organization for Standardization). ISO 639:1988 (E). Code for the
representation of names of languages. [Geneva]: International Organization for
Standardization�A 1988.
- ISO 3166
- (International Organization for Standardization). ISO 3166-1:1997 (E). Codes for the
representation of names of countries and their subdivisions -- Part 1: Country codes
[Geneva]: International Organization for Standardization�A 1997.
- ISO/IEC 10646
- ISO (International Organization for Standardization). ISO/IEC 10646-1993 (E).
Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1:
Architecture and Basic Multilingual Plane. [Geneva]: International Organization for
Standardization�A 1993 (plus amendments AM 1 through AM 7).
- Unicode
- The Unicode Consortium. The Unicode Standard�A Version 2.0. Reading�A Mass.:
Addison-Wesley Developers Press�A 1996.
- Aho/Ullman
- Aho�A Alfred V., Ravi Sethi�A and Jeffrey D. Ullman. Compilers: Principles,
Techniques, and Tools. Reading: Addison-Wesley, 1986, rpt. corr. 1988.
- Berners-Lee et al.
- Berners-Lee, T., R. Fielding, and L. Masinter. Uniform Resource Identifiers (URI):
Generic Syntax and Semantics. 1997. (Work in progress; see updates to RFC1738.)
- Br��gemann-Klein
- Br��gemann-Klein, Anne. Regular Expressions into Finite Automata. Extended
abstract in I. Simon, Hrsg., LATIN 1992, S. 97-98. Springer-Verlag, Berlin 1992. Full
Version in Theoretical Computer Science 120: 197-213, 1993.
- Br��gemann-Klein and Wood
- Br��gemann-Klein, Anne, and Derick Wood. Deterministic Regular Languages.
Universit�{ Freiburg, Institut f�d Informatik, Bericht 38, Oktober 1991.
- Clark
- James Clark. Comparison of SGML and XML. See http://www.w3.org/TR/NOTE-sgml-xml-971215.
- IETF RFC1738
- IETF (Internet Engineering Task Force). RFC 1738: Uniform Resource Locators (URL),
ed. T. Berners-Lee, L. Masinter, M. McCahill. 1994.
- IETF RFC1808
- IETF (Internet Engineering Task Force). RFC 1808: Relative Uniform Resource Locators,
ed. R. Fielding. 1995.
- IETF RFC2141
- IETF (Internet Engineering Task Force). RFC 2141: URN Syntax, ed. R. Moats.
1997.
- ISO 8879
- ISO (International Organization for Standardization). ISO 8879:1986(E). Information
processing -- Text and Office Systems -- Standard Generalized Markup Language (SGML).
First edition -- 1986-10-15. [Geneva]: International Organization for Standardization,
1986.
- ISO/IEC 10744
- ISO (International Organization for Standardization). ISO/IEC 10744-1992 (E).
Information technology -- Hypermedia/Time-based Structuring Language (HyTime). [Geneva]:
International Organization for Standardization, 1992. Extended Facilities Annexe.
[Geneva]: International Organization for Standardization, 1996.
�ھ� Unicode �зǤ��ҩw�q���S�ʡA�r���Q��������¦�r�� (�䤤�]�A�S���ܭ��Ÿ����ԤB�r��)�A���N�r���M�զX�r��
(�䤤�]�A�j�h�ƪ��ܭ��Ÿ�);
�o�����O���X�_�Ӳզ��F�r�����O�C�Ʀr (digits) �M�X�i�Ÿ�
(extenders) �]�U�۳Q�����C
�r�� (Characters) |
[84] |
Letter |
::= |
BaseChar | Ideographic |
[85] |
BaseChar |
::= |
[#x0041-#x005A] | [#x0061-#x007A] | [#x00C0-#x00D6] |
[#x00D8-#x00F6] | [#x00F8-#x00FF] | [#x0100-#x0131] | [#x0134-#x013E] | [#x0141-#x0148] |
[#x014A-#x017E] | [#x0180-#x01C3] | [#x01CD-#x01F0] | [#x01F4-#x01F5] | [#x01FA-#x0217] |
[#x0250-#x02A8] | [#x02BB-#x02C1] | #x0386 | [#x0388-#x038A] | #x038C | [#x038E-#x03A1] |
[#x03A3-#x03CE] | [#x03D0-#x03D6] | #x03DA | #x03DC | #x03DE | #x03E0 | [#x03E2-#x03F3] |
[#x0401-#x040C] | [#x040E-#x044F] | [#x0451-#x045C] | [#x045E-#x0481] | [#x0490-#x04C4] |
[#x04C7-#x04C8] | [#x04CB-#x04CC] | [#x04D0-#x04EB] | [#x04EE-#x04F5] | [#x04F8-#x04F9] |
[#x0531-#x0556] | #x0559 | [#x0561-#x0586] | [#x05D0-#x05EA] | [#x05F0-#x05F2] |
[#x0621-#x063A] | [#x0641-#x064A] | [#x0671-#x06B7] | [#x06BA-#x06BE] | [#x06C0-#x06CE] |
[#x06D0-#x06D3] | #x06D5 | [#x06E5-#x06E6] | [#x0905-#x0939] | #x093D | [#x0958-#x0961] |
[#x0985-#x098C] | [#x098F-#x0990] | [#x0993-#x09A8] | [#x09AA-#x09B0] | #x09B2 |
[#x09B6-#x09B9] | [#x09DC-#x09DD] | [#x09DF-#x09E1] | [#x09F0-#x09F1] | [#x0A05-#x0A0A] |
[#x0A0F-#x0A10] | [#x0A13-#x0A28] | [#x0A2A-#x0A30] | [#x0A32-#x0A33] | [#x0A35-#x0A36] |
[#x0A38-#x0A39] | [#x0A59-#x0A5C] | #x0A5E | [#x0A72-#x0A74] | [#x0A85-#x0A8B] | #x0A8D |
[#x0A8F-#x0A91] | [#x0A93-#x0AA8] | [#x0AAA-#x0AB0] | [#x0AB2-#x0AB3] | [#x0AB5-#x0AB9] |
#x0ABD | #x0AE0 | [#x0B05-#x0B0C] | [#x0B0F-#x0B10] | [#x0B13-#x0B28] | [#x0B2A-#x0B30] |
[#x0B32-#x0B33] | [#x0B36-#x0B39] | #x0B3D | [#x0B5C-#x0B5D] | [#x0B5F-#x0B61] |
[#x0B85-#x0B8A] | [#x0B8E-#x0B90] | [#x0B92-#x0B95] | [#x0B99-#x0B9A] | #x0B9C |
[#x0B9E-#x0B9F] | [#x0BA3-#x0BA4] | [#x0BA8-#x0BAA] | [#x0BAE-#x0BB5] | [#x0BB7-#x0BB9] |
[#x0C05-#x0C0C] | [#x0C0E-#x0C10] | [#x0C12-#x0C28] | [#x0C2A-#x0C33] | [#x0C35-#x0C39] |
[#x0C60-#x0C61] | [#x0C85-#x0C8C] | [#x0C8E-#x0C90] | [#x0C92-#x0CA8] | [#x0CAA-#x0CB3] |
[#x0CB5-#x0CB9] | #x0CDE | [#x0CE0-#x0CE1] | [#x0D05-#x0D0C] | [#x0D0E-#x0D10] |
[#x0D12-#x0D28] | [#x0D2A-#x0D39] | [#x0D60-#x0D61] | [#x0E01-#x0E2E] | #x0E30 |
[#x0E32-#x0E33] | [#x0E40-#x0E45] | [#x0E81-#x0E82] | #x0E84 | [#x0E87-#x0E88] | #x0E8A |
#x0E8D | [#x0E94-#x0E97] | [#x0E99-#x0E9F] | [#x0EA1-#x0EA3] | #x0EA5 | #x0EA7 |
[#x0EAA-#x0EAB] | [#x0EAD-#x0EAE] | #x0EB0 | [#x0EB2-#x0EB3] | #x0EBD | [#x0EC0-#x0EC4] |
[#x0F40-#x0F47] | [#x0F49-#x0F69] | [#x10A0-#x10C5] | [#x10D0-#x10F6] | #x1100 |
[#x1102-#x1103] | [#x1105-#x1107] | #x1109 | [#x110B-#x110C] | [#x110E-#x1112] | #x113C |
#x113E | #x1140 | #x114C | #x114E | #x1150 | [#x1154-#x1155] | #x1159 | [#x115F-#x1161] |
#x1163 | #x1165 | #x1167 | #x1169 | [#x116D-#x116E] | [#x1172-#x1173] | #x1175 | #x119E |
#x11A8 | #x11AB | [#x11AE-#x11AF] | [#x11B7-#x11B8] | #x11BA | [#x11BC-#x11C2] | #x11EB |
#x11F0 | #x11F9 | [#x1E00-#x1E9B] | [#x1EA0-#x1EF9] | [#x1F00-#x1F15] | [#x1F18-#x1F1D] |
[#x1F20-#x1F45] | [#x1F48-#x1F4D] | [#x1F50-#x1F57] | #x1F59 | #x1F5B | #x1F5D |
[#x1F5F-#x1F7D] | [#x1F80-#x1FB4] | [#x1FB6-#x1FBC] | #x1FBE | [#x1FC2-#x1FC4] |
[#x1FC6-#x1FCC] | [#x1FD0-#x1FD3] | [#x1FD6-#x1FDB] | [#x1FE0-#x1FEC] | [#x1FF2-#x1FF4] |
[#x1FF6-#x1FFC] | #x2126 | [#x212A-#x212B] | #x212E | [#x2180-#x2182] | [#x3041-#x3094] |
[#x30A1-#x30FA] | [#x3105-#x312C] | [#xAC00-#xD7A3] |
[86] |
Ideographic |
::= |
[#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029] |
[87] |
CombiningChar |
::= |
[#x0300-#x0345] | [#x0360-#x0361] | [#x0483-#x0486] |
[#x0591-#x05A1] | [#x05A3-#x05B9] | [#x05BB-#x05BD] | #x05BF | [#x05C1-#x05C2] | #x05C4 |
[#x064B-#x0652] | #x0670 | [#x06D6-#x06DC] | [#x06DD-#x06DF] | [#x06E0-#x06E4] |
[#x06E7-#x06E8] | [#x06EA-#x06ED] | [#x0901-#x0903] | #x093C | [#x093E-#x094C] | #x094D |
[#x0951-#x0954] | [#x0962-#x0963] | [#x0981-#x0983] | #x09BC | #x09BE | #x09BF |
[#x09C0-#x09C4] | [#x09C7-#x09C8] | [#x09CB-#x09CD] | #x09D7 | [#x09E2-#x09E3] | #x0A02 |
#x0A3C | #x0A3E | #x0A3F | [#x0A40-#x0A42] | [#x0A47-#x0A48] | [#x0A4B-#x0A4D] |
[#x0A70-#x0A71] | [#x0A81-#x0A83] | #x0ABC | [#x0ABE-#x0AC5] | [#x0AC7-#x0AC9] |
[#x0ACB-#x0ACD] | [#x0B01-#x0B03] | #x0B3C | [#x0B3E-#x0B43] | [#x0B47-#x0B48] |
[#x0B4B-#x0B4D] | [#x0B56-#x0B57] | [#x0B82-#x0B83] | [#x0BBE-#x0BC2] | [#x0BC6-#x0BC8] |
[#x0BCA-#x0BCD] | #x0BD7 | [#x0C01-#x0C03] | [#x0C3E-#x0C44] | [#x0C46-#x0C48] |
[#x0C4A-#x0C4D] | [#x0C55-#x0C56] | [#x0C82-#x0C83] | [#x0CBE-#x0CC4] | [#x0CC6-#x0CC8] |
[#x0CCA-#x0CCD] | [#x0CD5-#x0CD6] | [#x0D02-#x0D03] | [#x0D3E-#x0D43] | [#x0D46-#x0D48] |
[#x0D4A-#x0D4D] | #x0D57 | #x0E31 | [#x0E34-#x0E3A] | [#x0E47-#x0E4E] | #x0EB1 |
[#x0EB4-#x0EB9] | [#x0EBB-#x0EBC] | [#x0EC8-#x0ECD] | [#x0F18-#x0F19] | #x0F35 | #x0F37 |
#x0F39 | #x0F3E | #x0F3F | [#x0F71-#x0F84] | [#x0F86-#x0F8B] | [#x0F90-#x0F95] | #x0F97 |
[#x0F99-#x0FAD] | [#x0FB1-#x0FB7] | #x0FB9 | [#x20D0-#x20DC] | #x20E1 | [#x302A-#x302F] |
#x3099 | #x309A |
[88] |
Digit |
::= |
[#x0030-#x0039] | [#x0660-#x0669] | [#x06F0-#x06F9] |
[#x0966-#x096F] | [#x09E6-#x09EF] | [#x0A66-#x0A6F] | [#x0AE6-#x0AEF] | [#x0B66-#x0B6F] |
[#x0BE7-#x0BEF] | [#x0C66-#x0C6F] | [#x0CE6-#x0CEF] | [#x0D66-#x0D6F] | [#x0E50-#x0E59] |
[#x0ED0-#x0ED9] | [#x0F20-#x0F29] |
[89] |
Extender |
::= |
#x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 | #x0E46 | #x0EC6 |
#x3005 | [#x3031-#x3035] | [#x309D-#x309E] | [#x30FC-#x30FE] |
|
�b���B�w�q���r�����O�i�q Unicode �r����Ʈw���o��A�p�U�ҥܡG
- �W�٪��_�l�r�������ݩ� Ll�ALu�ALo�ALt�ANl �����@���C
- ���F�_�l�r�����~���W�٦r�������ݩ� Mc�AMe�AMn�ALm �� Nd
�����@���C
- �b�ۮe�� (�Y�r���N�X�j�� #xF900 �Τp�� #xFFFE ���r��)
�����r�������\�b XML �W�٤��X�{�C
- �����\�X�{�㦳�r���άۮe���� (�Y�r����Ʈw���� 5 �榳"compatibility
formatting tag"���r�� -- "<" �Хܵ۲� 5 �檺�}�l)
���r���C
- �U�C�r���Q�����W�ٰ_�l�r���ӫD�u�O�W�٦r���A�]���S�ʤ�N�����k����r�����O
(Alphabetic) �G [#x02BB-#x02C1]�A#x0559�A#x06E5�A#x06E6�C
- �����\�X�{�r�� #x20DD-#x20E0 (�P Unicode �� 5.14 �`�O���@�P)�C
- �r�� #x00B7
�Q���������@���X�i�Ÿ��A�]���S�ʤ�O�p���ӿ��ѥ����C
- �r�� #x0387 �Q�[�J�����@�ӦW�٦r���A�]�� #x00B7
�O�۷����W�d�Φ��C
- �r�� ':' �M '_' ���\�����W�ٰ_�l�r���C
- �r�� '-' �M '.' ���\�����W�٦r���C
XML�Q�]�p�� SGML ���@�Ӥl���A�C�@�����T�X�k��
(valid) XML ���]���ӬO�@�ӲŦX�W�檺 SGML ���C��� SGML �ӻ� XML����B�~����ԲӤ���аѦ�[Clark]�C
���������]�t�\�h��Ҩӻ����F�b "4.4 XML
�B�z��������M�ޥΪ��B�z"�@�`���W�w������- �M�r��-�Ѥު����ѩM�i�}�����ǡC
�p�G DTD ���]�t�ŧi
<!ENTITY example "<p>An ampersand (&#38;) may be escaped
numerically (&#38;#38;) or with a general entity
(&amp;).</p>" >
|
XML
�B�z���|�b��R����ŧi�ɿ��ѥX�r���ѤޡA�æb�N�U�C�r���x�s������"example
"���Ȥ��e�A�ѪR�o�Ǧr���Ѥ�:
<p>An ampersand (&) may be escaped
numerically (&#38;) or with a general entity
(&amp;).</p>
|
�b����"&example;
"���ޥη|�ɭP��s�Q��R�A����"p
"
�������_�l�M�������ҷ|�Q�ѧO�A�T�Ӥޥη|�Q�ѧO�M�i�}�A���G�|�ܦ��]�t�U�����e
(�Ҧ���ơA�L�w�ɲũμХ�) �� "p
"�����G
An ampersand (&) may be escaped
numerically (&) or with a general entity
(&).
|
�@�ӧ�������Ҥl�|����a�i�ܳo�dzW�h�M���̪��ĪG�C�b�U�����Ҥl���A�渹�u�O���F�����ѦҤ�K�C
1 <?xml version='1.0'?>
2 <!DOCTYPE test [
3 <!ELEMENT test (#PCDATA) >
4 <!ENTITY % xx '%zz;'>
5 <!ENTITY % zz '<!ENTITY tricky "error-prone" >' >
6 %xx;
7 ]>
8 <test>This sample shows a &tricky; method.</test>
|
���Ҥl�|���ͤU�C�ʧ@�G
- �b�� 4 ��A��r�� 37 ���ޥη|�Q�ߧY�i�}�A�Ѽƹ���"
xx
"�ϥέ�"%zz;
"���x�s��Ÿ������C�]���m����r���|�A���Q���y�A��Ѽƹ���"zz
"���ޥΤ��|�Q�ѧO�C(�ӥB�p�G���Q�ѧO���ܫh�|�O�@�ӿ��~�A�]��"zz
"�٨S���Q�ŧi�C)
- �b�� 5 ��A�r���Ѥ�"
<
"�|�Q�ߧY�i�}�A�ӰѼƹ���"zz
"�ϥθm����r"<!ENTITY
tricky "error-prone" >
"�Q�x�s�A���m����r�O�@�ӧΦ��X�k������ŧi�C
- �b�� 6 ��A"
xx
"���ޥη|�Q�ѧO�A"xx
"���m����r(�Y"%zz;
")�|�Q��R�C�H����"zz
"���ޥη|�Q�ѧO�A�����m����r("<!ENTITY
tricky "error-prone" >
")�|�Q��R�C���ɳq�ι���"tricky
"�|�Q�ŧi�A��m����r��"error-prone
"�C
- �b��8��A��q���"
tricky
"���ޥη|�Q�ѧO�îi�}�A�]��"test
"���������㤺�e���@�Ӧۧڴy�z
(self-describing) ���X��k���r��This sample shows a error-prone method.�C
���ۮe�ʦҶq�A�n�D���������ŧi�������e�ҫ��O�M�w�����C
SGML �n�D���e�ҫ��O�M�w���� (�Q�٬� "���ҭ��i�� "); ��
SGML �t�Ϋإߪ� XML
�B�z���i��|��D�M�w�������e�ҫ��Щ������~�C
�Ҧp�A���e�ҫ�((b, c) | (b, d))
�O�D�M�w�����A�]�������@�Ӷ}�l��b
�A��R���b�S�����Db
��O�������e�A�h�L�k���D�O�۲ũ�ҫ���������b
�C�b�o�ر��p�U�A��ӹ�b
���ޥΥi�H²�Ʀ���Ӫ��ޥΡA�ϱo�ҫ�����(b,(c
| d))
�C���ɶ}�l��b
�u�M���e�ҫ������@�ө��T���W�٬۲ŦX�C��R�����ݭn�ݤ����᭱���F���Ǥ��e�Cc
��d
����Q�����C
��Φ��ƪ����k�G�ϥ� Aho�ASethi �M Ullman �ҵ�[Aho/Ullman]3.9
�`�����зǺt��k 3.5�A�i�H�q���e�ҫ��غc�@�Ӧ������A�۰ʾ�
(finite state automation)�C�b�ܦh�o�˪��t��k���A�b�W�h�B�⦡ (regular
expression) �����C�@�Ӧ�m (�Y�W�h�B�⦡���y�k�𤤪��C�Ӹ��l�`�I)�A�|�غc�@���H��
(follow set)�F�p�G����@�Ӧ�m���H��������@���H���m�Q�Ь��P�@���������ɡA�h�����e�ҫ��|�o�Ϳ��~�A�åB�|���i���~�C
�s�b�N�\�h�����O�Ҧ��D�M�w�����e�ҫ��۰ʦa²�Ʀ��������M�w���ҫ��t��k�F�аѦ�
Bruggemann-Klein 1991 [Bruggemann-Klein].
XML
�s�X�ŧi�\��b�C�ӹ��餤�����@�Ӥ��������ҡA�Ω���X�ϥΤF��ئr���s�X�C�M�ӡA�b
XML
�B�z����Ū���o�Ӥ������ҫe�A��M���������D�ثe�ϥΪ��O���ئr���s�X�Цӳo���O���������ҭn�յ۪��ܥX�Ӫ��C�b�@�몺���p�U�A�����@�L�U�q�����p�C���L�b
XML ���ëD�����S���U�q�A�o�O�]�� XML
�b��Ӥ譱�W����F�@�몺���p�G�C�ع�@���]�u�䴩�@�Ӧ������r���s�X���A�åB���F�����`���p�U�i�H�۰��˴��C�ӹ��餤�ҥΦr���s�X�A����F
XML �s�X�ŧi����m�M���e�C�ܦh���p�U���F XML ��Ƭy (data stream)
�������~�A�t�~�٦���L�i�Ϊ���T�ӷ��C�ݵ��� XML
����e�{���B�z���ɨS���Φ������a (�~��)
��T�A�i�H�Ϥ��X��ر��p�C�ڭ̥��Ҽ{�Ĥ@�ر��p�C
�]���C�@�ӫD UTF-8 �� UTF-16 �榡�� XML ���������H XML
�s�X�ŧi�}�Y�A��}�l���X�Ӧr�������� '<?xml
'�A����ŦX�W�d���B�z���i�H�b���|�ӤK�i��ƪ���J��A�˴��X�A�Ω�U�C��ر��p�C�bŪ���o�ӦC���ɡA�b
UCS-4 ���A'<'�O"#x0000003C
"�A'?'�O"#x0000003F
"�AUTF-16
��Ƭy���줸�ն��ǼХܭn�D��"#xFEFF
"�A���D�o�ǬO�����U���C
00 00 00 3C
: UCS-4�Abig-endian �s�X���q�� (1234����)
3C 00 00 00
: UCS-4�Alittle-endian �s�X���q�� (4321����)
00 00 3C 00
: UCS-4�A���`���K�i��ƶ��� (2143)
00 3C 00 00
: UCS-4�A���`���K�i��ƶ��� (3412)
FE FF
: UTF-16�Abig-endian
FF FE
: UTF-16�Alittle-endian
00 3C 00 3F
: UTF-16�Abig-endian�A�L�줸�ն��ǼХ� (�p���Y��ӻ��|�X�{���~)
3C 00 3F 00
: UTF-16�Alittle-endian�A�L�줸�ն��ǼХ� (�p���Y��ӻ��|�X�{���~)
3C 3F 78 6D
: UTF-8�AISO 646�AASCII�AISO 8859 ���@�dz����AShift-JIS�AEUC�A��L����
7 �줸�A8 �줸�βV�X�줸�e�ת���O�� ASCII
�r�������̥��`����m�A�줸�e�סA���ܭȪ��s�X;����Ū����ڪ��s�X�ŧi���˴����ǾA�ΡA���O�]���Ҧ��o�ǽs�X��
ASCII �r�����줸�Ҧ��ۦP�A�ҥH�s�X�ŧi��������i�a�a�QŪ���C
4C 6F A7 94
: EBCDIC (�b�Y�Ǻ������A���㪺�s�X�ŧi������Ω�ϧO�ϥΤF���@�s�X��)
- ��L�G�L�s�X�ŧi�� UTF-8�A�άO��Ƭy�w�l�a�A������γQ�]�t�b�Y�إ~�h��Ƥ��C
���ص{�ת��۰��˴�������Ū�� XML
�s�X�ŧi�M��R�r���s�X�ѧO�r�C�r���s�X�ѧO�r���O�����Ω�Ϥ��C�ӽs�X���X�����ӧO����
(�Ҧp�q 8859 ���Ϥ��X UTF-8�A8859
�U�ӳ��������ۤ��Ϥ��A�H�ΰϤ��ҥΪ��S�w EBCDIC ���X���A����)�C
�]���s�X�ŧi�����e������ ASCII
�r���A�@���B�z���˴���ϥΪ��O���ӽs�X���X�A������i�a�aŪ����ӽs�X�ŧi�C�]����ڤ��A�Ҧ��s�x�ϥΪ��r���s�X���i�H�k�Ǧb�W�z���������AXML
�s�X�ŧi�X�z�a���\�i�a�����O���� (in-band labeling)
���r���s�X�A�Y�ϬO�b�@�~�t�Ωζǿ��w�h�Ū��~����T�ӷ��ä��i�a���ɭԡC
�@���B�z���˴���ҨϥΪ��r���s�X�A�h���N�|�@�X�X�A���ʧ@�A���O�w��C�ر��p�I�s
(invorking)
��W����J�`���A�άO��C�ӿ�J���r���I�s�A�X���ഫ��ơC
�N������ۧڼе� (self-labeling)
���t�Τ@�ˡA�Y����n����ܹ���r�����Ψ�s�X�ӨS����ۭק�s�X�ŧi���ܡAXML
�s�X�ŧi�N�L�k���`�B�@�C�r���s�X�`������@�H�������p�ߦa�T�O�е�����ҨϥΪ������M�~����T����T�ʡC
�ĤG�ӥi����p�b�� XML
������H���s�X��T�A�p�P�b�@���ɮרt�Τκ�����w�C���h�Ӹ�T�ӷ����i�ϥήɡA�۹蠟�����u�����ǩM���n���B�z�Ĭ��k���Ӧb�ǿ�
XML
�ɩҨϥΪ�������w�����w�C�Ҧp�A�������Ҫ��۹��u�����dzW�h�M�b�~�����Y����
MIME �����������ӬO�w�q text/xml �M application/xml MIME ������ RFC
���ɪ��@�����C�M�Ӱ�q�ʦҶq�A��ij�ϥΤU�C�W�h�C
- �p�G XML ����O�b�@���ɮפ��A�Φ줸�ն��ǼХܩM�s�X�ŧi PI (�p�G������)
�ӽT�w�r���s�X�C�Ҧ���L���_�M��T�ӷ����u�O�Ω���~�״_�C
- �p�G XML ����ϥ� text/xml MIME �����Ӷǻ��ɡA�h MIME ������
charset
�ѼƨM�w�F�r���s�X��k;�Ҧ���L���_�M��T�ӷ����u�O�Ω���~�״_�C
- �p�G XML ����ϥ� application/xml MIME
�����Ӷǻ��ɡA�h�Φ줸�ն��ǼХܩM�s�X�ŧi PI (�p�G������)�ӽT�w�r���s�X�C�Ҧ���L���_�M��T�ӷ����u�O�Ω���~�״_�C
�o�dzW�h�u�A�Ω�ʤ֨�w�h�Ť��ɪ����p�F�S�O�O������ RFC
���w�q�F�o�� text/xml �Mapplication/xml MIME �����ɡARFC
������ij�ѷ|���N�o�dzW�h�C
���W��ѥ� W3C XML�u�@�� (WG)
�����ç��o���C�u�@�է�㥻�W��ѨëD�N���Ҧ��u�@�զ������@�P�٦P���W�d
(Ķ���G���ܥ��W��ѬO��o�j�h�ƪ� XML
�u�@�զ����P�N�A�ּƦ����������P�N��)�C�{���M�H�e�� XML�u�@�զ����]�A�G
Jon Bosak, Sun (Chair); James Clark (Technical Lead); Tim Bray, Textuality and Netscape
(XML Co-editor); Jean Paoli, Microsoft (XML Co-editor); C. M. Sperberg-McQueen, U. of Ill.
(XML Co-editor); Dan Connolly, W3C (W3C Liaison); Paula Angerstein, Texcel; Steve DeRose,
INSO; Dave Hollander, HP; Eliot Kimber, ISOGEN; Eve Maler, ArborText; Tom Magliery, NCSA;
Murray Maloney, Muzmo and Grif; Makoto Murata, Fuji Xerox Information Systems; Joel Nava,
Adobe; Conleth O'Connell, Vignette; Peter Sharpe, SoftQuad; John Tigue, DataChannel
�@