json_filter/filter.go

375 lines
10 KiB
Go
Raw Normal View History

2022-07-04 17:50:42 +08:00
// Package filter ...
//
// Description : filter ...
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 2022-07-04 17:47
package filter
import (
2022-12-31 22:03:19 +08:00
"encoding/json"
2022-07-04 17:50:42 +08:00
"fmt"
2024-11-30 19:07:55 +08:00
"reflect"
"strings"
2024-11-30 22:04:29 +08:00
"git.zhangdeman.cn/zhangdeman/util"
2024-06-08 20:17:14 +08:00
"git.zhangdeman.cn/zhangdeman/consts"
2024-11-29 17:55:51 +08:00
"git.zhangdeman.cn/zhangdeman/json_filter/gjson_hack"
2024-09-25 18:35:40 +08:00
"git.zhangdeman.cn/zhangdeman/serialize"
2023-05-05 15:03:49 +08:00
"git.zhangdeman.cn/zhangdeman/wrapper"
2022-07-04 17:50:42 +08:00
2023-02-12 18:26:27 +08:00
"github.com/tidwall/gjson"
"github.com/tidwall/sjson"
2023-01-07 23:24:55 +08:00
"errors"
2022-07-04 17:50:42 +08:00
)
// NewFilter 过滤器实例
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 11:54 2022/7/4
func NewFilter(sourceData string, filterRuleList []MapRule) *filter {
return &filter{
sourceData: sourceData,
2022-12-31 22:03:19 +08:00
formatResult: "{}",
2022-07-04 17:50:42 +08:00
filterRuleList: filterRuleList,
}
}
// filter 数据过滤
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 11:58 2022/7/4
type filter struct {
sourceData string
2022-12-31 22:03:19 +08:00
formatResult string
2022-07-04 17:50:42 +08:00
filterRuleList []MapRule
}
// Deal ...
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 11:59 2022/7/4
2022-12-31 22:03:19 +08:00
func (f *filter) Deal() error {
var (
2024-11-30 19:07:55 +08:00
err error
2022-12-31 22:03:19 +08:00
)
2022-07-04 17:50:42 +08:00
for _, rule := range f.filterRuleList {
2024-11-29 17:55:51 +08:00
if len(rule.TargetPath) == 0 {
// 未配置目标路径则, 目标路径和源路径保持一致
rule.TargetPath = rule.SourcePath
}
2023-01-01 19:28:20 +08:00
if f.IsArray(rule) {
2024-11-29 17:55:51 +08:00
// 对于list的处理, 展开层级, 并自动追加到f.filterRuleList 后面
2023-01-01 19:28:20 +08:00
if err = f.handleArray(rule); nil != err {
return err
}
2022-07-04 17:50:42 +08:00
continue
}
2024-11-30 19:07:55 +08:00
if err = f.setResult(rule); nil != err {
2022-12-31 22:03:19 +08:00
return err
2022-07-04 17:50:42 +08:00
}
}
2022-12-31 22:03:19 +08:00
return nil
}
2023-01-01 19:28:20 +08:00
// IsArray 判断是否为数组
//
// Author : zhangdeman001@ke.com<张德满>
//
// Date : 17:48 2023/1/1
func (f *filter) IsArray(rule MapRule) bool {
2024-11-29 17:55:51 +08:00
return strings.Contains(rule.SourcePath, gjson_hack.ArrayIdxTpl)
2023-01-01 19:28:20 +08:00
}
// handleArray 处理数组(最复杂的场景)
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 17:41 2023/1/1
func (f *filter) handleArray(rule MapRule) error {
2024-11-30 19:07:55 +08:00
// 对于list的处理, 展开层级, 并自动追加到f.filterRuleList 后面
2023-01-02 21:17:51 +08:00
var (
err error
)
2024-11-30 19:07:55 +08:00
expendRes := &gjson_hack.ExpendArrayResult{
PathList: make([]string, 0),
PathMap: map[string]string{},
}
2024-11-30 19:07:55 +08:00
if err = gjson_hack.ExpandArrayPath(f.sourceData, rule.SourcePath, rule.TargetPath, expendRes); nil != err {
return err
}
2024-11-30 19:07:55 +08:00
for _, itemPath := range expendRes.PathList {
if err = f.setResult(MapRule{
SourcePath: itemPath,
TargetPath: expendRes.PathMap[itemPath],
Required: rule.Required,
DataType: rule.DataType,
DefaultValue: rule.DefaultValue,
}); nil != err {
2023-01-02 21:17:51 +08:00
return err
}
2024-11-30 19:07:55 +08:00
}
return nil
}
// setResult 设置结果
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 19:03 2024/11/30
func (f *filter) setResult(rule MapRule) error {
var (
err error
formatVal any
)
sourceResult := gjson.Get(f.sourceData, rule.SourcePath)
if formatVal, err = f.getValue(rule.DataType, sourceResult, rule.DefaultValue); nil != err {
return fmt.Errorf("%s = %v can not convert to %s : %s", rule.SourcePath, sourceResult.Value(), rule.DataType, err.Error())
}
if reflect.TypeOf(formatVal).Kind() == reflect.Map {
// 获取的数据是map类型, 处理数据覆盖
// eg : 配置如下两个规则 process.id(string) 、process(map[string]any)
// 若输入数据的process.id为int类型, 则格式化后的process.id必为 string, 应为 process.id 规则的控制更精细
gjsonVal := gjson.Get(f.formatResult, rule.TargetPath)
if gjsonVal.Exists() && gjsonVal.IsObject() {
var (
existRes = map[string]any{}
formatRes = map[string]any{}
)
// 已存在, 且是对象
_ = serialize.JSON.UnmarshalWithNumber([]byte(gjsonVal.String()), &existRes)
if err = serialize.JSON.Transition(formatVal, &formatRes); nil != err {
return errors.New("conflict data path config deal fail : " + err.Error())
}
for k, v := range existRes {
formatRes[k] = v
}
formatVal = formatRes // 重新赋值 formatVal
}
}
if f.formatResult, err = sjson.Set(f.formatResult, rule.TargetPath, formatVal); nil != err {
return err
2023-01-01 19:28:20 +08:00
}
return nil
}
2023-01-02 21:17:51 +08:00
// extraFinalResult 提取全部最底层结果
2023-01-01 19:28:20 +08:00
//
2023-01-02 21:17:51 +08:00
// Author : zhangdeman001@ke.com<张德满>
2023-01-01 19:28:20 +08:00
//
2023-01-02 21:17:51 +08:00
// Date : 14:00 2023/1/2
func (f *filter) getAllFinalData(res *[]string, resultList []gjson.Result, pathArr []string) {
if len(pathArr) == 1 {
2023-01-02 21:17:51 +08:00
for _, item := range resultList {
*res = append(*res, item.Get(pathArr[0]).String())
2023-01-02 21:17:51 +08:00
}
return
}
for _, item := range resultList {
f.getAllFinalData(res, item.Array(), pathArr[1:])
2023-01-02 21:17:51 +08:00
}
return
2023-01-01 19:28:20 +08:00
}
2022-12-31 22:03:19 +08:00
// String 获取格式化之后的字符串
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 21:18 2022/12/31
func (f *filter) String() string {
return f.formatResult
}
// Byte 获取格式化之后的字节数组
//
// Author : zhangdeman001@ke.com<张德满>
//
// Date : 21:18 2022/12/31
func (f *filter) Byte() []byte {
return []byte(f.String())
}
// Parse 解析返回结果
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 21:20 2022/12/31
func (f *filter) Parse(receiver interface{}) error {
if nil == receiver {
return errors.New("receiver is nil")
}
return json.Unmarshal(f.Byte(), receiver)
2022-07-04 17:50:42 +08:00
}
// getValue 获取值
//
// Author : go_developer@163.com<白茶清欢>
//
// Date : 12:25 2022/7/4
2024-11-25 14:57:08 +08:00
func (f *filter) getValue(dataType consts.DataType, sourceValue gjson.Result, defaultValue string) (any, error) {
sourceValueStr := defaultValue
if sourceValue.Exists() {
2023-05-04 18:18:03 +08:00
str := sourceValue.String()
if len(str) > 0 {
sourceValueStr = str
}
}
2023-05-05 15:03:49 +08:00
strVal := wrapper.String(sourceValueStr)
2022-07-04 17:50:42 +08:00
switch dataType {
2024-06-08 20:17:14 +08:00
case consts.DataTypeInt:
intVal := strVal.ToInt()
return intVal.Value, intVal.Err
case consts.DataTypeUint:
uintVal := strVal.ToUint64()
return uintVal.Value, uintVal.Err
case consts.DataTypeBool:
boolVal := strVal.ToBool()
return boolVal.Value, boolVal.Err
case consts.DataTypeFloat:
floatVal := strVal.ToFloat64()
return floatVal.Value, floatVal.Err
case consts.DataTypeString:
return strVal.Value(), nil
case consts.DataTypeAny:
if sourceValue.Exists() {
2024-11-30 22:04:29 +08:00
// 可能存在精度丢失, 原因 : gjson.Value 内置的转换, int64 超过一定大小会存在丢失精度问题
if sourceValue.Num > 0 {
// 说明是数字
var res float64
if err := util.ConvertAssign(&res, sourceValue.String()); nil != err {
return nil, err
}
return res, nil
}
2024-06-08 20:17:14 +08:00
return sourceValue.Value(), nil
}
return defaultValue, nil
case consts.DataTypeSliceAny:
2023-05-04 18:18:03 +08:00
// 任意类型的list
2024-06-08 20:17:14 +08:00
sliceVal := strVal.ToAnySlice()
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceInt, consts.DataTypeSliceIntWithChar:
// 任意类型的list
2024-11-30 21:53:28 +08:00
if strings.HasPrefix(strVal.Value(), "[") && strings.HasSuffix(strVal.Value(), "]") {
// 序列化之后的数组
sliceVal := strVal.ToInt64Slice()
return sliceVal.Value, sliceVal.Err
}
// 分隔的数组
sliceVal := strVal.ToInt64Slice(",")
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceUint, consts.DataTypeSliceUintWithChar:
// 任意类型的list
if strings.HasPrefix(strVal.Value(), "[") && strings.HasPrefix(strVal.Value(), "]") {
// 序列化之后的数组
sliceVal := strVal.ToUint64Slice()
return sliceVal.Value, sliceVal.Err
}
// 分隔的数组
sliceVal := strVal.ToUint64Slice(",")
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceFloat, consts.DataTypeSliceFloatWithChar:
// 任意类型的list
if strings.HasPrefix(strVal.Value(), "[") && strings.HasPrefix(strVal.Value(), "]") {
// 序列化之后的数组
sliceVal := strVal.ToFloat64Slice()
return sliceVal.Value, sliceVal.Err
}
// 分隔的数组
sliceVal := strVal.ToFloat64Slice(",")
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceBool, consts.DataTypeSliceBoolWithChar:
// 任意类型的list
if strings.HasPrefix(strVal.Value(), "[") && strings.HasPrefix(strVal.Value(), "]") {
// 序列化之后的数组
sliceVal := strVal.ToBoolSlice()
return sliceVal.Value, sliceVal.Err
}
// 分隔的数组
sliceVal := strVal.ToBoolSlice(",")
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceString, consts.DataTypeSliceStringWithChar:
// 任意类型的list
if strings.HasPrefix(strVal.Value(), "[") && strings.HasPrefix(strVal.Value(), "]") {
// 序列化之后的数组
sliceVal := strVal.ToStringSlice()
return sliceVal.Value, sliceVal.Err
}
// 分隔的数组
sliceVal := strVal.ToStringSlice(",")
return sliceVal.Value, sliceVal.Err
case consts.DataTypeSliceSlice, consts.DataTypeMapAnyAny:
2024-11-25 14:29:19 +08:00
return nil, errors.New(consts.DataTypeSliceSlice.String() + " : data type is not support")
case consts.DataTypeSliceMapStringAny:
if !sourceValue.IsArray() {
return nil, errors.New("data type is not array")
}
var res []map[string]any
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrInt:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]int64
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrUint:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]uint64
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrFloat:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]float64
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrBool:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]bool
err := strVal.ToStruct(&res)
return res, err
2024-06-08 20:17:14 +08:00
case consts.DataTypeMapStrAny:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]any
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrStr:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string]string
err := strVal.ToStruct(&res)
return res, err
case consts.DataTypeMapStrSlice:
if !sourceValue.IsObject() {
2024-11-30 21:53:28 +08:00
return nil, ErrDataIsNotObject
}
var res map[string][]any
err := strVal.ToStruct(&res)
return res, err
2022-07-04 17:50:42 +08:00
default:
2024-11-30 21:53:28 +08:00
return nil, errors.New("`" + dataType.String() + "` is not support!")
2022-07-04 17:50:42 +08:00
}
}