Rewrite fzf in Go

author: Junegunn Choi <junegunn.c@gmail.com> 2015-01-02 04:49:30 +0900
committer: Junegunn Choi <junegunn.c@gmail.com> 2015-01-04 00:37:29 +0900
commit: f3177305d5572b26f135fc045481358b4eb1bf69 (patch)
tree: d59fd9587e44e998581a131875bf45e243df6c6e /src/tokenizer.go
parent: 7ba93d9f8351be64b37c65ae04d594ee261d5d26 (diff)
1 files changed, 194 insertions, 0 deletions
diff --git a/src/tokenizer.go b/src/tokenizer.go
new file mode 100644
index 00000000..c187529b
--- /dev/null
+++ b/src/tokenizer.go
@@ -0,0 +1,194 @@
+package fzf
+
+import (
+	"regexp"
+	"strconv"
+	"strings"
+)
+
+const RANGE_ELLIPSIS = 0
+
+type Range struct {
+	begin int
+	end   int
+}
+
+type Transformed struct {
+	whole *string
+	parts []Token
+}
+
+type Token struct {
+	text         *string
+	prefixLength int
+}
+
+func ParseRange(str *string) (Range, bool) {
+	if (*str) == ".." {
+		return Range{RANGE_ELLIPSIS, RANGE_ELLIPSIS}, true
+	} else if strings.HasPrefix(*str, "..") {
+		end, err := strconv.Atoi((*str)[2:])
+		if err != nil || end == 0 {
+			return Range{}, false
+		} else {
+			return Range{RANGE_ELLIPSIS, end}, true
+		}
+	} else if strings.HasSuffix(*str, "..") {
+		begin, err := strconv.Atoi((*str)[:len(*str)-2])
+		if err != nil || begin == 0 {
+			return Range{}, false
+		} else {
+			return Range{begin, RANGE_ELLIPSIS}, true
+		}
+	} else if strings.Contains(*str, "..") {
+		ns := strings.Split(*str, "..")
+		if len(ns) != 2 {
+			return Range{}, false
+		}
+		begin, err1 := strconv.Atoi(ns[0])
+		end, err2 := strconv.Atoi(ns[1])
+		if err1 != nil || err2 != nil {
+			return Range{}, false
+		}
+		return Range{begin, end}, true
+	}
+
+	n, err := strconv.Atoi(*str)
+	if err != nil || n == 0 {
+		return Range{}, false
+	}
+	return Range{n, n}, true
+}
+
+func withPrefixLengths(tokens []string, begin int) []Token {
+	ret := make([]Token, len(tokens))
+
+	prefixLength := begin
+	for idx, token := range tokens {
+		// Need to define a new local variable instead of the reused token to take
+		// the pointer to it
+		str := token
+		ret[idx] = Token{text: &str, prefixLength: prefixLength}
+		prefixLength += len([]rune(token))
+	}
+	return ret
+}
+
+const (
+	AWK_NIL = iota
+	AWK_BLACK
+	AWK_WHITE
+)
+
+func awkTokenizer(input *string) ([]string, int) {
+	// 9, 32
+	ret := []string{}
+	str := []rune{}
+	prefixLength := 0
+	state := AWK_NIL
+	for _, r := range []rune(*input) {
+		white := r == 9 || r == 32
+		switch state {
+		case AWK_NIL:
+			if white {
+				prefixLength++
+			} else {
+				state = AWK_BLACK
+				str = append(str, r)
+			}
+		case AWK_BLACK:
+			str = append(str, r)
+			if white {
+				state = AWK_WHITE
+			}
+		case AWK_WHITE:
+			if white {
+				str = append(str, r)
+			} else {
+				ret = append(ret, string(str))
+				state = AWK_BLACK
+				str = []rune{r}
+			}
+		}
+	}
+	if len(str) > 0 {
+		ret = append(ret, string(str))
+	}
+	return ret, prefixLength
+}
+
+func Tokenize(str *string, delimiter *regexp.Regexp) []Token {
+	prefixLength := 0
+	if delimiter == nil {
+		// AWK-style (\S+\s*)
+		tokens, prefixLength := awkTokenizer(str)
+		return withPrefixLengths(tokens, prefixLength)
+	} else {
+		tokens := delimiter.FindAllString(*str, -1)
+		return withPrefixLengths(tokens, prefixLength)
+	}
+}
+
+func joinTokens(tokens []Token) string {
+	ret := ""
+	for _, token := range tokens {
+		ret += *token.text
+	}
+	return ret
+}
+
+func Transform(tokens []Token, withNth []Range) *Transformed {
+	transTokens := make([]Token, len(withNth))
+	numTokens := len(tokens)
+	whole := ""
+	for idx, r := range withNth {
+		part := ""
+		minIdx := 0
+		if r.begin == r.end {
+			idx := r.begin
+			if idx == RANGE_ELLIPSIS {
+				part += joinTokens(tokens)
+			} else {
+				if idx < 0 {
+					idx += numTokens + 1
+				}
+				if idx >= 1 && idx <= numTokens {
+					minIdx = idx - 1
+					part += *tokens[idx-1].text
+				}
+			}
+		} else {
+			var begin, end int
+			if r.begin == RANGE_ELLIPSIS { // ..N
+				begin, end = 1, r.end
+				if end < 0 {
+					end += numTokens + 1
+				}
+			} else if r.end == RANGE_ELLIPSIS { // N..
+				begin, end = r.begin, numTokens
+				if begin < 0 {
+					begin += numTokens + 1
+				}
+			} else {
+				begin, end = r.begin, r.end
+				if begin < 0 {
+					begin += numTokens + 1
+				}
+				if end < 0 {
+					end += numTokens + 1
+				}
+			}
+			minIdx = Max(0, begin-1)
+			for idx := begin; idx <= end; idx++ {
+				if idx >= 1 && idx <= numTokens {
+					part += *tokens[idx-1].text
+				}
+			}
+		}
+		whole += part
+		transTokens[idx] = Token{&part, tokens[minIdx].prefixLength}
+	}
+	return &Transformed{
+		whole: &whole,
+		parts: transTokens}
+}
author	Junegunn Choi <junegunn.c@gmail.com>	2015-01-02 04:49:30 +0900
committer	Junegunn Choi <junegunn.c@gmail.com>	2015-01-04 00:37:29 +0900
commit	f3177305d5572b26f135fc045481358b4eb1bf69 (patch)
tree	d59fd9587e44e998581a131875bf45e243df6c6e /src/tokenizer.go
parent	7ba93d9f8351be64b37c65ae04d594ee261d5d26 (diff)