# Here, we import the tecton library and use its `get_feature_vector` convenience function, 
# but we can also save the import and issue an HTTP request directly to the Tecton endpoint
import tecton
import mlflow
from dotenv import load_dotenv, find_dotenv
import os
import pandas as pd


# Load the TECTON_API_KEY from a .env file - in production you might
# pass this in as an environment variable or use a secrets manager
load_dotenv(find_dotenv())

True


ws = tecton.get_workspace('prod')
fs = tecton.get_feature_service('fraud_prediction_service')


tecton_api_key = os.environ['TECTON_API_KEY']
tecton.set_credentials(tecton_api_key)


vec = fs.get_feature_vector(join_keys={"user_id": "C1986564990"}).to_pandas()


vec.T


req_cols = pd.DataFrame({
  'amount': 123.45,
  'type_cash_in': True,
  'type_cash_out': False,
  'type_debit': False,
  'type_payment': False,
  'type_transfer': False
}, index=[0])


req = vec.merge(req_cols, left_index=True, right_index=True)


req_ordered = req[['amount', 'type_cash_in',
       'type_cash_out', 'type_debit', 'type_payment', 'type_transfer',
       'transaction_aggregates.transaction_sum_1h_1h',
       'transaction_aggregates.transaction_sum_12h_1h',
       'transaction_aggregates.transaction_sum_24h_1h',
       'transaction_aggregates.transaction_sum_72h_1h',
       'transaction_aggregates.transaction_sum_168h_1h',
       'transaction_aggregates.transaction_sum_960h_1h',
       'transaction_aggregates.amount_mean_1h_1h',
       'transaction_aggregates.amount_mean_12h_1h',
       'transaction_aggregates.amount_mean_24h_1h',
       'transaction_aggregates.amount_mean_72h_1h',
       'transaction_aggregates.amount_mean_168h_1h',
       'transaction_aggregates.amount_mean_960h_1h',
       'users_credit_score.credit_score',
       'days_since_last_transaction.days_since_last', 'user_age_days.age']]


req_ordered.T


# We load the model from mlflow - in Databricks we transitioned the model trained above to "production" so we can specify that 
# stage below
os.environ['MLFLOW_TRACKING_URI'] = 'databricks'
model = mlflow.sklearn.load_model('models:/fraud_detection/Production')


# Predict will return a dataframe. Since we only passed in one vector to predict, res will be length 1.
res = model.predict(req_ordered)


# This is the result of the prediction (0 = not fraud, 1 = fraud)
res[0]

0

	0
days_since_last_transaction.days_since_last	82
transaction_aggregates.amount_mean_12h_1h	None
transaction_aggregates.amount_mean_168h_1h	None
transaction_aggregates.amount_mean_1h_1h	None
transaction_aggregates.amount_mean_24h_1h	None
transaction_aggregates.amount_mean_72h_1h	None
transaction_aggregates.amount_mean_960h_1h	None
transaction_aggregates.transaction_sum_12h_1h	None
transaction_aggregates.transaction_sum_168h_1h	None
transaction_aggregates.transaction_sum_1h_1h	None
transaction_aggregates.transaction_sum_24h_1h	None
transaction_aggregates.transaction_sum_72h_1h	None
transaction_aggregates.transaction_sum_960h_1h	None
user_age_days.age	10477
users_credit_score.credit_score	None

	0
amount	123.45
type_cash_in	True
type_cash_out	False
type_debit	False
type_payment	False
type_transfer	False
transaction_aggregates.transaction_sum_1h_1h	None
transaction_aggregates.transaction_sum_12h_1h	None
transaction_aggregates.transaction_sum_24h_1h	None
transaction_aggregates.transaction_sum_72h_1h	None
transaction_aggregates.transaction_sum_168h_1h	None
transaction_aggregates.transaction_sum_960h_1h	None
transaction_aggregates.amount_mean_1h_1h	None
transaction_aggregates.amount_mean_12h_1h	None
transaction_aggregates.amount_mean_24h_1h	None
transaction_aggregates.amount_mean_72h_1h	None
transaction_aggregates.amount_mean_168h_1h	None
transaction_aggregates.amount_mean_960h_1h	None
users_credit_score.credit_score	None
days_since_last_transaction.days_since_last	82
user_age_days.age	10477

Inference using Tecton¶