gateway/modules/aicore/aicorePluginOpenai.py

import logging
import base64
import httpx
from typing import Dict, Any, List, Union
from fastapi import HTTPException
from modules.shared.configuration import APP_CONFIG
from modules.aicore.aicoreBase import BaseConnectorAi
from modules.datamodels.datamodelAi import AiModel, ModelCapabilitiesEnum, PriorityEnum, ProcessingModeEnum, OperationTypeEnum

# Configure logger
logger = logging.getLogger(__name__)

class ContextLengthExceededException(Exception):
    """Exception raised when the context length exceeds the model's limit"""
    pass

def loadConfigData():
    """Load configuration data for OpenAI connector"""
    return {
        "apiKey": APP_CONFIG.get('Connector_AiOpenai_API_SECRET'),
        "apiUrl": APP_CONFIG.get('Connector_AiOpenai_API_URL'),
        "modelName": APP_CONFIG.get('Connector_AiOpenai_MODEL_NAME'),
        "temperature": float(APP_CONFIG.get('Connector_AiOpenai_TEMPERATURE')),
    }

class AiOpenai(BaseConnectorAi):
    """Connector for communication with the OpenAI API."""

    def __init__(self):
        super().__init__()
        # Load configuration
        self.config = loadConfigData()
        self.apiKey = self.config["apiKey"]
        self.apiUrl = self.config["apiUrl"]
        self.modelName = self.config["modelName"]

        # HttpClient for API calls
        self.httpClient = httpx.AsyncClient(
            timeout=120.0,  # Longer timeout for complex requests
            headers={
                "Authorization": f"Bearer {self.apiKey}",
                "Content-Type": "application/json"
            }
        )
        logger.info(f"OpenAI Connector initialized with model: {self.modelName}")

    def getConnectorType(self) -> str:
        """Get the connector type identifier."""
        return "openai"

    def getModels(self) -> List[AiModel]:
        """Get all available OpenAI models."""
        return [
            AiModel(
                name="openai_callAiBasic",
                displayName="GPT-4o",
                connectorType="openai",
                maxTokens=128000,
                contextLength=128000,
                costPer1kTokensInput=0.03,
                costPer1kTokensOutput=0.06,
                speedRating=8,
                qualityRating=9,
                capabilities=[ModelCapabilitiesEnum.TEXT_GENERATION, ModelCapabilitiesEnum.CHAT, ModelCapabilitiesEnum.REASONING, ModelCapabilitiesEnum.ANALYSIS],
                functionCall=self.callAiBasic,
                priority=PriorityEnum.BALANCED,
                processingMode=ProcessingModeEnum.ADVANCED,
                operationTypes=[OperationTypeEnum.GENERAL, OperationTypeEnum.PLAN, OperationTypeEnum.ANALYSE, OperationTypeEnum.GENERATE],
                version="gpt-4o",
                calculatePriceUsd=lambda processingTime, bytesSent, bytesReceived: (bytesSent / 4 / 1000) * 0.03 + (bytesReceived / 4 / 1000) * 0.06
            ),
            AiModel(
                name="openai_callAiBasic_gpt35",
                displayName="GPT-3.5 Turbo",
                connectorType="openai",
                maxTokens=16000,
                contextLength=16000,
                costPer1kTokensInput=0.0015,
                costPer1kTokensOutput=0.002,
                speedRating=9,
                qualityRating=7,
                capabilities=[ModelCapabilitiesEnum.TEXT_GENERATION, ModelCapabilitiesEnum.CHAT, ModelCapabilitiesEnum.REASONING],
                functionCall=self.callAiBasic,
                priority=PriorityEnum.SPEED,
                processingMode=ProcessingModeEnum.BASIC,
                operationTypes=[OperationTypeEnum.GENERAL, OperationTypeEnum.PLAN, OperationTypeEnum.GENERATE],
                version="gpt-3.5-turbo",
                calculatePriceUsd=lambda processingTime, bytesSent, bytesReceived: (bytesSent / 4 / 1000) * 0.0015 + (bytesReceived / 4 / 1000) * 0.002
            ),
            AiModel(
                name="openai_callAiImage",
                displayName="GPT-4o Vision",
                connectorType="openai",
                maxTokens=128000,
                contextLength=128000,
                costPer1kTokensInput=0.03,
                costPer1kTokensOutput=0.06,
                speedRating=7,
                qualityRating=9,
                capabilities=[ModelCapabilitiesEnum.IMAGE_ANALYSE, ModelCapabilitiesEnum.VISION, ModelCapabilitiesEnum.MULTIMODAL],
                functionCall=self.callAiImage,
                priority=PriorityEnum.QUALITY,
                processingMode=ProcessingModeEnum.DETAILED,
                operationTypes=[OperationTypeEnum.IMAGE_ANALYSE],
                version="gpt-4o",
                calculatePriceUsd=lambda processingTime, bytesSent, bytesReceived: (bytesSent / 4 / 1000) * 0.03 + (bytesReceived / 4 / 1000) * 0.06
            ),
            AiModel(
                name="openai_generateImage",
                displayName="DALL-E 3",
                connectorType="openai",
                maxTokens=0,  # Image generation doesn't use tokens
                contextLength=0,
                costPer1kTokensInput=0.04,
                costPer1kTokensOutput=0.0,
                speedRating=6,
                qualityRating=9,
                capabilities=[ModelCapabilitiesEnum.IMAGE_GENERATE, ModelCapabilitiesEnum.ART, ModelCapabilitiesEnum.VISUAL_CREATION],
                functionCall=self.generateImage,
                priority=PriorityEnum.QUALITY,
                processingMode=ProcessingModeEnum.DETAILED,
                operationTypes=[OperationTypeEnum.IMAGE_GENERATE],
                version="dall-e-3",
                calculatePriceUsd=lambda processingTime, bytesSent, bytesReceived: (bytesSent / 4 / 1000) * 0.04
            )
        ]

    async def callAiBasic(self, messages: List[Dict[str, Any]], temperature: float = None, maxTokens: int = None) -> str:
        """
        Calls the OpenAI API with the given messages.

        Args:
            messages: List of messages in OpenAI format (role, content)
            temperature: Temperature for response generation (0.0-1.0)
            maxTokens: Maximum number of tokens in the response

        Returns:
            The response from the OpenAI API

        Raises:
            HTTPException: For errors in API communication
        """
        try:
            # Use parameters from configuration if none were overridden
            if temperature is None:
                temperature = self.config.get("temperature", 0.2)

            # Don't set maxTokens from config - let the model use its full context length
            # Our continuation system handles stopping early via prompt engineering

            payload = {
                "model": self.modelName,
                "messages": messages,
                "temperature": temperature
            }

            # Add max_tokens - use provided value or throw error
            if maxTokens is None:
                raise ValueError("maxTokens must be provided for OpenAI API calls")
            payload["max_tokens"] = maxTokens

            response = await self.httpClient.post(
                self.apiUrl,
                json=payload
            )

            if response.status_code != 200:
                error_message = f"OpenAI API error: {response.status_code} - {response.text}"
                logger.error(error_message)

                # Check for context length exceeded error
                if response.status_code == 400:
                    try:
                        error_data = response.json()
                        if (error_data.get("error", {}).get("code") == "context_length_exceeded" or
                            "context length" in error_data.get("error", {}).get("message", "").lower()):
                            # Raise a specific exception for context length issues
                            raise ContextLengthExceededException(
                                f"Context length exceeded: {error_data.get('error', {}).get('message', 'Unknown error')}"
                            )
                    except (ValueError, KeyError):
                        pass  # If we can't parse the error, fall through to generic error

                # Include the actual error details in the exception
                raise HTTPException(status_code=500, detail=error_message)

            responseJson = response.json()
            content = responseJson["choices"][0]["message"]["content"]
            return content

        except ContextLengthExceededException:
            # Re-raise context length exceptions without wrapping
            raise
        except Exception as e:
            logger.error(f"Error calling OpenAI API: {str(e)}")
            raise HTTPException(status_code=500, detail=f"Error calling OpenAI API: {str(e)}")

    async def callAiImage(self, prompt: str, imageData: Union[str, bytes], mimeType: str = None) -> str:
        """
        Analyzes an image with the OpenAI Vision API.

        Args:
            imageData: base64encoded data
            mimeType: The MIME type of the image (optional, only for binary data)
            prompt: The prompt for analysis

        Returns:
            The response from the OpenAI Vision API as text
        """
        try:
            logger.debug(f"Starting image analysis with query '{prompt}' for size {len(imageData)}B...")

            # Ensure imageData is a string (base64 encoded)
            if not isinstance(imageData, str):
                raise ValueError("imageData must be a string (base64 encoded)")

            # Fix base64 padding if needed
            padding_needed = len(imageData) % 4
            if padding_needed:
                imageData += '=' * (4 - padding_needed)

            # Use default MIME type if not provided
            if not mimeType:
                mimeType = "image/jpeg"

            logger.debug(f"Using MIME type: {mimeType}")
            logger.debug(f"Base64 data length: {len(imageData)} characters")

            # Create the data URL format as required by OpenAI Vision API
            data_url = f"data:{mimeType};base64,{imageData}"

            messages = [
                {
                    "role": "user",
                    "content": [
                        {"type": "text", "text": prompt},
                        {
                            "type": "image_url",
                            "image_url": {
                                "url": data_url
                            }
                        }
                    ]
                }
            ]

            # Use a vision-capable model for image analysis
            # Override the model for vision tasks
            visionModel = "gpt-4o"  # or "gpt-4-vision-preview" depending on availability

            # Use parameters from configuration
            temperature = self.config.get("temperature", 0.2)
            # Don't set maxTokens - let the model use its full context length

            payload = {
                "model": visionModel,
                "messages": messages,
                "temperature": temperature
            }

            response = await self.httpClient.post(
                self.apiUrl,
                json=payload
            )

            if response.status_code != 200:
                logger.error(f"OpenAI API error: {response.status_code} - {response.text}")
                raise HTTPException(status_code=500, detail="Error communicating with OpenAI API")

            responseJson = response.json()
            content = responseJson["choices"][0]["message"]["content"]
            return content

            # Return content
            return response

        except Exception as e:
            logger.error(f"Error during image analysis: {str(e)}", exc_info=True)
            return f"[Error during image analysis: {str(e)}]"

    async def generateImage(self, prompt: str, size: str = "1024x1024", quality: str = "standard", style: str = "vivid") -> Dict[str, Any]:
        """
        Generate an image using DALL-E 3.

        Args:
            prompt: The text prompt for image generation
            size: Image size (1024x1024, 1792x1024, or 1024x1792)
            quality: Image quality (standard or hd)
            style: Image style (vivid or natural)

        Returns:
            Dictionary with success status and image data
        """
        try:
            logger.debug(f"Starting image generation with prompt: '{prompt[:100]}...'")

            # DALL-E 3 API endpoint
            dalle_url = "https://api.openai.com/v1/images/generations"

            payload = {
                "model": "dall-e-3",
                "prompt": prompt,
                "size": size,
                "quality": quality,
                "style": style,
                "n": 1,
                "response_format": "b64_json"  # Get base64 data directly instead of URLs
            }

            # Create a separate client for DALL-E API calls
            dalle_client = httpx.AsyncClient(
                timeout=120.0,
                headers={
                    "Authorization": f"Bearer {self.apiKey}",
                    "Content-Type": "application/json"
                }
            )

            response = await dalle_client.post(
                dalle_url,
                json=payload
            )

            await dalle_client.aclose()

            if response.status_code != 200:
                logger.error(f"DALL-E API error: {response.status_code} - {response.text}")
                return {
                    "success": False,
                    "error": f"DALL-E API error: {response.status_code} - {response.text}"
                }

            responseJson = response.json()

            if "data" in responseJson and len(responseJson["data"]) > 0:
                image_data = responseJson["data"][0]["b64_json"]

                logger.info(f"Successfully generated image: {len(image_data)} characters")
                return {
                    "success": True,
                    "image_data": image_data,
                    "size": size,
                    "quality": quality,
                    "style": style
                }
            else:
                logger.error("No image data in DALL-E response")
                return {
                    "success": False,
                    "error": "No image data in DALL-E response"
                }

        except Exception as e:
            logger.error(f"Error during image generation: {str(e)}", exc_info=True)
            return {
                "success": False,
                "error": f"Error during image generation: {str(e)}"
            }