euler-copilot-framework/apps/llm/token.py-代码预览-euler-copilot-framework:基于 openEuler 操作系统的大模型应用平台项目 - AtomGit

Zzxstty拆分问答场景下rag的类，完善问题改写的类（history压缩在一轮中）

49b1d78e创建于 2025年7月22日历史提交

# Copyright (c) Huawei Technologies Co., Ltd. 2023-2025. All rights reserved.
"""用于计算Token消耗量"""
import logging

from apps.common.singleton import SingletonMeta
logger = logging.getLogger(__name__)


class TokenCalculator(metaclass=SingletonMeta):
    """用于计算Token消耗量"""

    def __init__(self) -> None:
        """初始化Tokenizer"""
        import tiktoken
        self._encoder = tiktoken.get_encoding("cl100k_base")

    def calculate_token_length(self, messages: list[dict[str, str]], *, pure_text: bool = False) -> int:
        """使用ChatGPT的cl100k tokenizer，估算Token消耗量"""
        result = 0
        if not pure_text:
            result += 3 * (len(messages) + 1)

        for msg in messages:
            result += len(self._encoder.encode(msg["content"]))

        return result

    @staticmethod
    def get_k_tokens_words_from_content(content: str, k: int | None = None) -> str:
        """获取k个token的词"""
        if k is None:
            return content
        if k <= 0:
            return ""
        try:
            if TokenCalculator().calculate_token_length(messages=[
                {"role": "user", "content": content},
            ], pure_text=True) <= k:
                return content
            l = 0
            r = len(content)
            while l + 1 < r:
                mid = (l + r) // 2
                if TokenCalculator().calculate_token_length(messages=[
                    {"role": "user", "content": content[:mid]},
                ], pure_text=True) <= k:
                    l = mid
                else:
                    r = mid
            return content[:l]
        except Exception:
            logger.exception("[RAG] 获取k个token的词失败")
        return ""