html: clean up the z.rawTag calculation in the tokenizer.

R=andybalholm CC=golang-dev https://golang.org/cl/5440064
author: Nigel Tao <nigeltao@golang.org> 2011-11-30 17:00:37 +1100
committer: Nigel Tao <nigeltao@golang.org> 2011-11-30 17:00:37 +1100
commit: 849fc19cab2c3059379b21dde019f521ce772f5c (patch)
tree: 8cb166269287b117116841aa37d533008244d994
parent: 3b3922771a1ace2e4781f7e53a16cf566f2c27bf (diff)
download: go-849fc19cab2c3059379b21dde019f521ce772f5c.tar.gz
go-849fc19cab2c3059379b21dde019f521ce772f5c.zip
1 files changed, 42 insertions, 9 deletions
diff --git a/src/pkg/html/token.go b/src/pkg/html/token.go
index 57e70ffeed..69af96840c 100644
--- a/src/pkg/html/token.go
+++ b/src/pkg/html/token.go
@@ -379,6 +379,28 @@ func (z *Tokenizer) readMarkupDeclaration() TokenType {
 	return DoctypeToken
 }
 
+// startTagIn returns whether the start tag in z.buf[z.data.start:z.data.end]
+// case-insensitively matches any element of ss.
+func (z *Tokenizer) startTagIn(ss ...string) bool {
+loop:
+	for _, s := range ss {
+		if z.data.end-z.data.start != len(s) {
+			continue loop
+		}
+		for i := 0; i < len(s); i++ {
+			c := z.buf[z.data.start+i]
+			if 'A' <= c && c <= 'Z' {
+				c += 'a' - 'A'
+			}
+			if c != s[i] {
+				continue loop
+			}
+		}
+		return true
+	}
+	return false
+}
+
 // readStartTag reads the next start tag token. The opening "<a" has already
 // been consumed, where 'a' means anything in [A-Za-z].
 func (z *Tokenizer) readStartTag() TokenType {
@@ -406,15 +428,26 @@ func (z *Tokenizer) readStartTag() TokenType {
 		}
 	}
 	// Several tags flag the tokenizer's next token as raw.
-	// The tag name lengths of these special cases ranges in [3, 9].
-	if x := z.data.end - z.data.start; 3 <= x && x <= 9 {
-		switch z.buf[z.data.start] {
-		case 'i', 'n', 'p', 's', 't', 'x', 'I', 'N', 'P', 'S', 'T', 'X':
-			switch s := strings.ToLower(string(z.buf[z.data.start:z.data.end])); s {
-			case "iframe", "noembed", "noframes", "noscript", "plaintext", "script", "style", "textarea", "title", "xmp":
-				z.rawTag = s
-			}
-		}
+	c, raw := z.buf[z.data.start], false
+	if 'A' <= c && c <= 'Z' {
+		c += 'a' - 'A'
+	}
+	switch c {
+	case 'i':
+		raw = z.startTagIn("iframe")
+	case 'n':
+		raw = z.startTagIn("noembed", "noframes", "noscript")
+	case 'p':
+		raw = z.startTagIn("plaintext")
+	case 's':
+		raw = z.startTagIn("script", "style")
+	case 't':
+		raw = z.startTagIn("textarea", "title")
+	case 'x':
+		raw = z.startTagIn("xmp")
+	}
+	if raw {
+		z.rawTag = strings.ToLower(string(z.buf[z.data.start:z.data.end]))
 	}
 	// Look for a self-closing token like "<br/>".
 	if z.err == nil && z.buf[z.raw.end-2] == '/' {
author	Nigel Tao <nigeltao@golang.org>	2011-11-30 17:00:37 +1100
committer	Nigel Tao <nigeltao@golang.org>	2011-11-30 17:00:37 +1100
commit	849fc19cab2c3059379b21dde019f521ce772f5c (patch)
tree	8cb166269287b117116841aa37d533008244d994
parent	3b3922771a1ace2e4781f7e53a16cf566f2c27bf (diff)
download	go-849fc19cab2c3059379b21dde019f521ce772f5c.tar.gz go-849fc19cab2c3059379b21dde019f521ce772f5c.zip